Analiza czynnikowa i analizy wielowymiarowe w środowisku Julia

Analiza czynnikowa i analizy wielowymiarowe w środowisku Julia, segmentacja wielu zmiennych

Szkolenia otwarte

3000 PLN

- Szkolenie, w którym uczestniczą osoby z różnych firm
- Plan szkolenia taki, jak przedstawiony na stronie
- Małe grupy szkoleniowe, 3-10 osób

Szkolenia zamknięte

Cena ustalana indywidualnie

- Szkolenie realizowane na indywidualne zamówienie
- Termin i miejsce szkolenia ustalamy indywidualnie
- Plan szkolenia dostosowany do potrzeb firmy

O szkoleniu

Opanowanie metod opartych o Analizę Głównych Składowych pozwala spojrzeć na dane w nowy, uniwersalny sposób. Przeprowadzenie tego procesu osobiście jest wejściem do dosłownie wielowymiarowego świata. Metoda ta pozwoliła w XX wieku fizykom na przekroczenie granicy poznania świata kwantowego, jest również podstawą w rodzącym sie świecie big data.

Redukcja danych i odkrywanie ukrytych zależności miedzy dużą liczbą zmiennych jest kluczowym problemem w big data. Środowisko Julia posiada bardzo wydajne biblioteki pozwalające przetwarzać wielkie macierze. Szkolenie ma na celu naukę, krok po kroku, poprzez przeprowadzenie i pokazanie całego procesu oraz jego zrozumienie i pełną interpretację wyników.

Dla kogo jest to szkolenie?

Analitycy, programiści i menadżerowie, odpowiedzialni za analizę i wykorzystanie w biznesie dużych zbiorów danych.

Czego się nauczę?

  • Zrozumiesz i nauczysz się redukować i przeprowadzać segmentację danych techniką Analizy Głównych Składowych (PCA) (oraz Analizy Czynnikowej)
  • Wykorzystasz automatyczne zrównoleglenia obliczeń dużych macierzy danych
  • Poznasz Julię jako wydajne środowisko obliczeń dla Data Science
  • Nauczysz się praktycznie interpretować wyniki analizy i transformacji danych.

Plan szkolenia

  1. Wprowadzenie do Języka i środowiska programistycznego Julia
    • Instalacja środowiska Julia
    • Instalacja pakietów
    • Czytanie i zapis danych, wykorzystanie formatów danych adekwatnych do postaci danych roboczych
    • Transformacja danych
    • Pętle i funkcje w Julii, makra
    • “Dane rzadkie” (Sprase arrays), skuteczna metoda eliminowania zer z danych
  2. Wprowadzenie do analizy danych
    • Analiza zależność miedzy zmiennymi
    • Miary zależności
    • Wariancja i jej znaczenie w opisie zbiorów
    • Kowariancja a korelacja, praktyczne skutki użycia i interpretacja.
    • Skalowanie i standaryzacja, ich wpływ na interpretację wyników
  3. Analiza głównych składowych i ich obliczanie
    • Obliczanie macierzy korelacji i kowariancji dla dużych zbiorów danych
    • Pojęcia wartości i wektorów własnych i ich obliczanie
    • Kryteria wyboru liczby zredukowanych wymiarów
    • Wyliczanie Głównych Składowych i budowanie nowego modelu danych
    • Interpretacja modelu opisanego w układzie Głównych Składowych
    • Analiza związków statystycznych Głównych Składowych z danymi pierwotnymi
    • Interpretacja i opis danych pierwotnych przy użyciu nowego modelu
  4. Przegląd możliwość analizy i klasyfikacji przy użyciu innych rotowanych układów odniesienia.
  5. Analiza Głównych Składowych na tle innych metod
    • Analiza Głównych Składowych jest jedna z podstawowych, kanonicznych metod przekształcenia dużych ilości danych w taki sposób aby były łatwe w interpretacji a poprzez znaczne zmniejszenie ilości danych (przy zachowaniu w nich prawie pełnej informacji) jest bardzo przydatna we wszelkich procesach big data oraz tam gdzie krytycznym czynnikiem jest czas.

Plan Szkolenia

Plan jest pusty

Instruktorzy


Zapytaj o szkolenie

Jestem zainteresowany/a

Podaj wynik działania:


 

Zapytaj o szkolenie zamknięte

Jestem zainteresowany/a

Podaj wynik działania:


 

Zapytaj o szkolenie otwarte
 

Jestem zainteresowany/a

Podaj wynik działania:


 

Zapytaj o ścieżkę szkoleniową
 

Rodzaj ścieżki:

Preferowany tryb szkolenia:

DziennyPopołudniowyWeekendowy

Podaj wynik działania:


 
Szybki kontakt