
Maszynowe Uczenie i Analiza Danych z Scala
Szkolenia otwarte
3800 PLN
- Szkolenie, w którym uczestniczą osoby z różnych firm
- Plan szkolenia taki, jak przedstawiony na stronie
- Małe grupy szkoleniowe, 3-10 osób
Szkolenia zamknięte
Cena ustalana indywidualnie
- Szkolenie realizowane na indywidualne zamówienie
- Termin i miejsce szkolenia ustalamy indywidualnie
- Plan szkolenia dostosowany do potrzeb firmy
O szkoleniu
Szkolenie Maszynowe uczenie i analiza danych z Scala to drugie szkolenie ze ścieżki Scala dla Data Scientist. Swoim zakresem szkolenie obejmuje tematy niezbędne do pracy Data Scientist. Wśród najważniejszych należy wyróżnić tworzenie i wykorzystanie algorytmów maszynowego uczenia do problemów segmentacji, klasyfikacji oraz predykcji.
Szkolenie zostało stworzone przez praktyków Data Science . Uczestnicy szkolenia zdobędą wiedzę do tworzenia rozwiązań maszynowego uczenia przy pomocy Scali i powiązanych technologii takich jak Akka, oraz Apache Spark.
Dla kogo jest to szkolenie?
Data Scientist
Data Engineer
Czego się nauczę?
- Ładować, przetwarzać i obrabiać dane za pomocą bibliotek Breeze oraz Spark
- Wizualizować dane za pomocą Apache Zeppelin i Bokeh Scala
- Tworzyć algorytmy maszynowego uczenia i wdrażać je przy pomocy EC2 oraz YARN
- Wykorzystywać najpopularniejsze algorytmy maszynowego uczenia do rozwiązywania najczęściej spotykanych problemów
Plan szkolenia
Część I – Wstęp do analizy danych
- Podstawowe operacje na danych w Breeze
- Intstalacja Breeze – Biblioteki do liniowej algebry
- Operacje na wektorach i macierzach
- Ładowanie i zapisywanie plików płaskich
- Przetwarzanie danych w formacie Spark DataFrames
- Tworzenie DataFrame z plików CSV
- Podstawowe manipulacje DataFrames
- Ładowanie JSON jako DataFrame
- Ładowanie danych z RDBMS
- Skalowanie problemów
- Przesyłanie zadań do klastra Spark
- Uruchamianie klastra na EC2
- Wywoływanie zadań na Mesos
- Wywoływanie zadań na Yarn
- Wizualizacja danych
- Wizualizacja przy pomocy Zeppelin
- Tworzenie wykresów z interfejsem Bokeh-Scala
Część II – Machine learning
- Wprowadzenie do Machine learning
- Rodzaje problemów dla maszynowego uczenia
- Taksonomia problemów maszynowego uczenia i przegląd algorytmów
- Rola Scala w maszynowym uczeniu
- Narzędzia i technologie ML
- Projektowanie i ocena modeli ML
- Cykl produkcyjny w ML
- Modelowanie jako proces
- Walidacja algorytmów i strategie
- Przeuczenie
- Kompromis Bias – Variance
- Przygotowanie danych do maszynowego uczenia
- Obserwacje nietypowe
- Standaryzacja, normalizacja
- Binaryzacja danych jakościowych
- Binning
- Regresja i Regularyzacja
- Model regresji liniowej
- Regularyzacja L1, L2
- Optymalizacja
- Regresja logistyczna
- Klasyfikacja z Naive Bayes
- Prawdopodobieństwo warunkowe i twierdzenie Bayesa
- Klasyfikator Naive Bayes
- Implementacja do danych tekstowych
- Support Vector Machines
- Funkcje jądrowe
- SVM
- Support vector classifier
- Support Vector Regressor
- Wykrywanie anomalii
- Sieci Neuronowe
- Feed forward Neural Networks
- Multilayer Perceptron
- Funkcje aktywujące, straty
- Architektura sieci
- Ewaluacja
- Algorytmy genetyczne
- Ewolucja
- Komponenty algorytmów genetycznych
- Implementacja
- Zastosowanie algorytmów genetycznych
- Reinforcement learning
- Wprowadzenie
- Q-Learning
- Implementacja
- Learning classifier systems
- Uczenie bez nadzoru ( z ang. Unsupervised learning)
- Clustering
- Redukcja wymiaru
- Algorytm expectation maximization
- Skalowalne platformy
- Scala
- Akka
- Apache Spark