
Szkolenie Machine Learning w R
Szkolenia otwarte
3200 PLN
Szkolenia zamknięte
Cena ustalana indywidualnie
O szkoleniu
Uczenie maszynowe (z ang. Machine Learning) to szybko rozwijająca się dziedzina, która daje niesamowite możliwości analizy danych, wyciągania z nich wniosków i formułowania reguł. Machine learning łączy w sobie elementy informatyki, statystyki i automatyki i składa się z algorytmów, które pozwalają na podstawie istniejących danych prognozować oraz klasyfikować nowe dane, rozpoznawać tekst, zdjęcia i mowę, czy tworzyć systemy rekomendacyjne. Umiejętność wykorzystania technik uczenia maszynowego jest w dzisiejszych czasach doskonałym atutem każdego analityka danych.
Podczas szkolenia uczestnicy od podstaw zapoznają się z technikami uczenia maszynowego i za pomocą licznych ćwiczeń i przykładów zdobędą praktyczną wiedzę niezbędną w codziennej pracy.
Dla kogo jest to szkolenie?
Szkolenie kierowane jest do osób, które chcą poznać techniki uczenia maszynowego i zdobyć wiedzę praktyczną przydatną w pracy zawodowej. Do udziału w szkoleniu wymagana jest podstawowa znajomość programu R.
Nasze szkolenie kierujemy do:
- Analityków
- Statystyków
- Data scientists
- Programistów
Nasi kursanci pracują z R w różnych branżach (finanse, IT, produkcja, medycyna itp.). Zawsze podczas szkolenia staramy się położyć nacisk na te elementy R, które będą im najbardziej przydatne w codziennej pracy.
Czego się nauczę?
- Podczas szkolenia uczestnik pozna podstawy uczenia maszynowego oraz nauczy się budować szereg modeli służących do klasyfikacji lub numerycznej predykcji danych.
Po ukończeniu szkolenia, uczestnik będzie potrafił:
- Dobrać odpowiedni algorytm do problemu – Omówimy istniejące metody uczenia maszynowego z podziałem na uczenie z nadzorem i bez nadzoru
- Przetestować model i ocenić jego zdolności predykcyjne – Pokażemy jak ocenić jakość zbudowanego modelu dokładność predykcji. Omówimy takie problemy jak np. przetrenowanie, czyli nadmierne dopasowanie modelu do danych.
- Zbudować model regresji liniowej – Omówimy, czym jest regresja liniowa i jakie są jej zastosowania. Pokażemy jak zbudować poprawny model o dobrych właściwościach predykcyjnych. Taki model można wykorzystać np. do wyjaśnienia czynników kształtujących cenę lub prognozowania wielkości sprzedaży.
- Zbudować model klasyfikacyjny – Omówimy różne rodzaje algorytmów, które pozwalają na stworzenie modelu klasyfikacyjnego. Będą to między innymi sieci neuronowe, drzewa decyzyjne i algorytmy SVM. Takie modele wykorzystywane są na przykład w systemach rekomendacji.
- Zbudować model uczenia bez nadzoru – Nauczymy jak stworzyć model w sytuacji, gdy nie posiadamy danych do walidacji modelu.
- Poprawić zdolności predykcyjne modelu – Pokażemy metody, które pozwalają zwiększyć zdolności predykcyjne modelu jak np. boosting czy random forest.
Plan szkolenia
- Wprowadzenie do uczenia maszynowego
- Możliwości i ograniczenia uczenia maszynowego
- Uczenie z nadzorem
- Uczenie bez nadzoru
- Uczenie przez wzmacnianie
- Uczenie ewolucyjne
- Maszynowe uczenie krok po kroku
- Statistical learning vs Machine learning
- Przykłady zastosowań
- Elementy programowania w R
- Podstawowe obiekty danych
- Konstrukcje if, for, while
- Funkcje map_*
- Importowanie danych
- Bibilioteki R wykorzystywane w uczeniu maszynowym
- Tworzenie skryptów i projektów
- Dynamiczne raporty z RMarkdown
- Testowanie zdolności predykcyjnej algorytmów maszynowego uczenia
- Kompromis pomiędzy interpretacją modelu a dokładnością prognoz
- Przeuczenie ( z ang. Overfitting)
- Zbiór uczący, testowy i walidacyjny
- Miary trafności w prognozowaniu ilościowym i klasyfikacji
- Macierz klasyfikacji, krzywa ROC, miara AUC
- Cross-Validation – k-Fold, LOCV
- Bootstrap
- Regresja liniowa – problem prognozowania danych numerycznych
- Współczynnik korelacji
- Regresja liniowa wielu zmiennych
- Interpretacja graficzna modelu regresji
- Metody doboru zmiennych objaśniających
- Prognozowanie i wybór modelu
- Przykłady i Ćwiczenia w R
- Regresja logistyczna – problem klasyfikacji
- Regresja logistyczna dla zmiennych binarnych
- Regresja logistyczna dla zmiennych wielomianowych
- Estymacja i prognozowanie
- Przykłady i Ćwiczenia w R
- Naive Bayes – problem klasyfikacji
- Prawdopodobieństwo warunkowe i twierdzenie Bayesa
- Algorytm naiwnego klasyfikatora bayesowskiego
- Przykłady i Ćwiczenia w R
- k- Nearest Neighbors –problem klasyfikacji
- Algorytm leniwego uczenia k-NN
- Miary odległości obserwacji
- Wybór k- liczby najbliższych sąsiadów
- Przykłady i ćwiczenia w R
- Drzewa decyzyjne – problem klasyfikacji
- Konstruowanie drzew wg zasady – Dziel i Rządz
- Algorytm C5.0 tworzenia drzew decyzyjnych
- Podział na podstawie miar entropii, gini
- Przycinanie drzew
- Reguły decyzyjne
- Przykłady i ćwiczenia w R
- Rozszerzenie: Regresyjne drzewa decyzyjne
- Sieci neuronowe – problem klasyfikacji i prognozowania danych numerycznych
- Biologiczne podstawy sieci neuronowych
- Funkcje aktywujące
- Topologia sieci neuronowych
- Estymacja sieci neuronowych metodą backpropagation
- Przykłady i ćwiczenia w R
- Support Vector Machines
- Interpretacja graficzna klasyfikacji z pomocą SVM
- Problem nieseparowalnych danych
- Algorytm SVM
- Kernels
- Rozszerzenia: regresja SVM
- Przykłady i ćwiczenia w R
- Reguły asocjacyjne
- Algorytm apriori
- Budowa reguły z wykorzystaniem algorytmu apriori
- Przykłady i ćwiczenia w R
- Metody redukcji zmiennych
- Analiza dyskryminacyjna – LDA
- Metoda głównych składowych – PCA
- Analiza czynnikowa – FA
- ISOMAP – MDS
- Przykłady i ćwiczenia w R
- Tuning parametrów – zwiększanie zdolności predykcyjnych
- Tuningowanie parametrów z pomocą pakietu caret
- Przykłady i ćwiczenia w R
- Ensemble learning – zwiększanie zdolności predykcyjnych
- Boosting – AdaBoost, Stumping
- Gradient boosting machines
- Bagging
- Randomizacja
- Random forests
- Additive regression
- Przykłady i ćwiczenia w R
- Metody uczenia bez nadzoru
- k-Means
- k-Medoids
- Segmentacja hierearchiczna
- Segmentacja na bazie rozkładu gęstości
- Przykłady i ćwiczenia w R