Data minig – przetwarzanie danych z wykorzystaniem Knime

Szkolenia i kursy komputerowe IT - MDDP Akademia Biznesu

Data minig – przetwarzanie danych z wykorzystaniem Knime

Kategoria:

Adresaci szkolenia

Szkolenie przeznaczone dla analityków danych, twórców raportów, osób zainteresowanych zagadnieniami data mining.
Stare powiedzenie analityków mówi, że 80% ich pracy to żmudne przygotowanie danych, które jest etapem niezbędnym przed pracą nad modelami analitycznymi. Oferowane szkolenie dotyczy tych pierwszych 80% pracy analityka danych. Jednak z narzędziami takimi jak Knime, proces ten wcale nie musi być nudny. Wręcz przeciwnie. Odpowiednia wiedza i umiejętność posługiwania się narzędziami są pasjonujące i czynią z analityka osobę ważną dla każdej organizacji. 

Wymagana wiedza przed szkoleniem
Od kursantów wymaga się jedynie wiedzy z podstawowej obsługi komputera. Poruszanie się w środowisku systemów Microsoft i pakietów Office jest wystarczającym kryterium dla uczestnictwa w kursie.

Uczestnicy kursu zdobędą umiejętności w zakresie

– projektowania procesów analitycznych
– podstawowej obsługi Knime w zakresie przekształcania danych
– wykorzystania Knime do raportowania cyklicznego
– automatyzacji procesów analitycznych

Program szkolenia

Dzień I
1. Data Mining
– co przez to rozumieć
– do czego można go wykorzystać

2. Metodyka prowadzenia projektów data mining
– CRISP-DM: przykład metodyki data mining
– zrozumienie danych i przygotowanie danych, czyli długa droga do budowania modeli data mining
– znaczenie jakości danych (braki danych, postać danych, rozkłady zmiennych)

3. Narzędzia data mining
– GUI vs Excell
– możliwości przetwarzania dużych wolumenów
– automatyzacja i wizualizacja
– Knime jako platforma data mining

4. Wprowadzenie do Knime:
– opis głównych obszarów interfejsu
– dodatki
– sterowniki
– workspace (złożenie workspace)
– zwiększanie zasobów
– import/export workflow (ćwiczenie)
– przegląd ustawień
– zakres widoku
– przydatne linki

5. Wczytywanie danych do Knime
– txt
– csv
– xls
– xml
Przedstawienie funkcjonalności.
Ćwiczenia dla powyższych.
– baza danych (na przykładzie Postgresql):
– zdefiniowanie połączenia, zaczytanie poprzez kod sql, z wykorzystaniem kreatora pgAdmin, poprzez funkcjonalności Knime
– proste selekcje z wykorzystaniem klauzuli WHERE
Przedstawienie funkcjonalności i samodzielne ćwiczenia.

6. Przygotowanie danych do analiz cz. I
– formaty danych w Knime
– ujednolicanie formatów przy wykorzystaniu różnych źródeł danych
Przedstawienie funkcjonalności i samodzielne ćwiczenia w zakresie zmian typów zmiennych „string to data”, „string to integer” i inne.

7. Przygotowanie danych do analiz cz. II – Operacje na rekordach
– selekcja: row filter, row splitter, numeric value row filter, nominal value row filter, extract time window, reference row filter, rule based row filter
– łączenie: joiner i cross joiner
– dołączanie – concatenate
– agregacja – group by
Przedstawienie funkcjonalności i samodzielne ćwiczenia.
Zadanie łączące kilka funkcjonalności.

DZIEŃ II
1. Przygotowanie danych do analiz cz. III – operacje na kolumnach:
– filtrowanie: column filter i column resorter
– zmiana nazw i formatów: column rename
– podział i łączenie kolumn: cell splitter, column combiner
– zliczanie wartości z kolumn: column agregator
– porównania kolumn: column comprator
Przedstawienie funkcjonalności i samodzielne ćwiczenia.
Zadanie łączące kilka funkcjonalności.

2. Przygotowanie danych do analiz cz. IV – przekształcenia danych
– operacje na datach: date field extractor, date difference, create date, date shift
– rekodowanie: histogram, color manager, autobinner, binner
– wyliczanie nowych zmiennych: rule engine, math formula, string manipulations, constant value
– restrukturyzacja zbioru: one to many
– opóźnienia – lag
Przedstawienie funkcjonalności i samodzielne ćwiczenia.
Zadanie łączące kilka funkcjonalności.

3. Automatyzacja zadań z Knime
– ćwiczenie przekrojowe zakończone eksportem do Excell + dashboard w Excelu
– automatyzacja z wykorzystaniem pliku .bat i schedulera Windows
– budowa workflow generującego cykliczne raporty wraz z generowaniem nazwy raportu zawierającego bieżącą datę.
– automatyzacja wysyłania raportu mailem

Informacje organizacyjne

Koszt uczestnictwa jednej osoby: 1500 zł + 23% VAT

Promocja!
Koszt uczestnictwa jednej osoby w terminie 29-30.11.2018 r.: 1100 zł + 23% VAT

Cena obejmuje: uczestnictwo w zajęciach, materiały szkoleniowe, przerwy kawowe, lunch, certyfikat.

Godziny zajęć: 10:00 – 16:00

Czas trwania: 2 dni szkoleniowe

Miejsce zajęć: siedziba Akademii Biznesu MDDP lub centrum miasta

Informacje:
Justyna Świdnicka
tel. (48) (22) 208 28 47, fax. (48) (22) 211 20 90
justyna.swidnicka@akademiamddp.pl

Powyższy temat możemy zrealizować dla Państwa także w formie szkolenia zamkniętego.
Szczegóły znajdą Państwo tutaj >>
Zapraszamy serdecznie!

Terminy

Nasi Klienci