Programowanie i Analiza Danych w Microsoft R Open

Programowanie i Analiza Danych w Microsoft R Open

Szkolenia otwarte

3000 PLN

- Szkolenie, w którym uczestniczą osoby z różnych firm
- Plan szkolenia taki, jak przedstawiony na stronie
- Małe grupy szkoleniowe, 3-10 osób

Szkolenia zamknięte

Cena ustalana indywidualnie

- Szkolenie realizowane na indywidualne zamówienie
- Termin i miejsce szkolenia ustalamy indywidualnie
- Plan szkolenia dostosowany do potrzeb firmy

O szkoleniu

Microsoft R Open wcześniej znany jako Revolution R Open to wzbogacona dystrybucja R, 9 najpopularniejszego języka programowania na świecie, przez Microsoft. Rosnąca popularność i ogromny potencjał w zastosowaniach data science skłoniły giganta z Redmond do przygotowania własnej dystrybucji i wzbogacenia jej o kilka przydatnych funkcji takich jak przetwarzanie równoległe kodu za pomocą nowych pakietów do obliczeń czy narzędzia do tworzenia powtarzalnych wyników.

Szkolenie Programowanie i Analiza Danych w Microsoft R Open obejmuje programem wprowadzenie do programowania w języku R, analizę danych, wizualizację oraz wprowadzenie do nowych funkcji oferowanych wyłącznie przez dystrybucję Microsoft R Open.

Dla kogo jest to szkolenie?

Z uwagi na niezależność języka R od dystrybucji szkolenie to jest dedykowane wszystkim którzy chcą się nauczyć programować w R, analizować dane oraz poznać dodatkowe funkcje i pakiety oferowane przez dystrybucję Microsoft R Open.

Czego się nauczę?

Po ukończeniu szkolenia, uczestnik będzie potrafił:

  • Interpretować i modyfikować programy napisane w R
  • Pisać programy w R, tworzyć przejrzyste skrypty do analiz
  • Tworzyć funkcje do rozwiązywania powtarzalnych problemów
  • Importować dane na potrzeby analiz z plików i baz danych
  • Przetwarzać i manipulować dane korzystając z różnych pakietów
  • Prognozować, klasyfikować, wykrywać odstające obserwacje
  • Korzystać z algorytmów maszynowego uczenia, tuningować
  • Tworzyć dynamiczne raporty analityczne z Rmarkdown
  • Korzystać z udogodnień dystrybucji Microsoft R Open

Plan szkolenia

Programowanie w języku R

  1. Wprowadzenie
    • Jak działa R – Program i ewaluacja
    • Pierwsza sesja w R, interaktywnie i wsadowo
    • Zintegrowane środowisko programistyczne Rstudio
    • Przegląd podstawowych obiektów i struktur danych
    • Przykład skryptu do analizy regresji liniowej krok po kroku
    • Wyszukiwanie pomocy, funkcje, pakiety i obiekty
    • Pakiety w R, instalacja, budowa i ładowanie do pamięci
  2. Podstawy języka R
    • Podstawowe obliczenia matematyczne i operatory
    • Zasady tworzenia nazw dla obiektów w R i Namespaces
    • Specjalne obiekty liczbowe, liczby, wartości logiczne i tekstowe
    • Klasy obiektów, testowanie i zarządzanie klasami obiektów
    • Pamięć robocza dla obiektów
  3. Podstawy programowania w R
    • Skrypty, tworzenie, modyfikowanie i praca projektowa w R
    • Od poleceń do funkcji i programowania funkcyjnego
    • Pakiety, instalacja zarządzanie i wersjonowanie
    • Debugowanie kodu w skrypcie czyli jak znaleźć błędy i je rozwiązać
    • Błędy i ostrzeżenia, Interaktywne śledzenie błędów
  4. Obiekty danych w R
    • Wektory –tworzenie, modyfikacja, przydatne funkcje, indeksowanie
    • Macierze i Tablice – tworzenie, zarządzanie indeksowanie, obliczenia
    • Listy – tworzenie list, atomowe i rekursywne elementy, indeksowanie
    • Data Frame – tworzenie tablic, manipulacje, indeksowanie i nazwy
    • Faktory –poziomy, zastosowanie, uporządkowane faktory
  5. Struktury programistyczne w R
    • Konstrukcje warunkowe if else, wektoryzacja if, wielokrotny wybór
    • Pętle typu repeat, while, for, replikacja,
    • Funkcje z rodziny apply dla optymalizacji wykonania pętli
    • Wektoryzacja kodu i przyspieszenie wykonania kodu
    • Symulacje w R, generowanie liczb losowych
    • Funkcje, wartości domyślne dla parametrów, tworzenie, wywoływanie
    • Środowisko funkcji i zasięg, hierarchia, namespaces
  6. Obiekty tekstowe, wyrażenia regularne
    • Obliczenia tekstowe, podstawowe funkcje do pracy z tekstem
    • Wyrażenia regularne, manipulacje, importowanie
    • Przetwarzanie tekstu na macierz do postac TF, TFIDF

Analiza danych w R

  1. Import Eksport Danych w R
    • Wbudowane źródła danych z pakietów
    • Wczytywanie plików tesktowych, TAB, CSV, XML, HTML
    • Wczytywanie plików binarnych, XLSX, SAS, STATA,SPSS, MATLAB
    • Dane ze stron internetowych, automatyzacja zczytywania stron w R
    • Łączenie i pobieranie danych z bazy danych, korzystanie z SQL w R
    • Eksportowanie wyników i danych do innych plików
  2. Przygotowanie danych do analizy
    • Łączenie danych i usuwanie duplikatów wartości
    • Czyszczenie danych i zmiana typu zmiennych, kształtu
    • Manipulacje tablicami danych, zmiana nazw, obserwacji
    • Wartości brakujące i nietypowe – wykrywanie, usuwanie, imputacja
    • Dodatkowe funkcje z pakietów dplyr, data.table, aggregate reshape2
    • Standaryzacja danych i normalizacja
  3. Eksploracja, Rozkłady, Modelowanie danych
    • Statystyki opisowe, korelacja i kowariancja
    • Rozkłady prawdopodobieństwa, generowanie liczb losowych
    • Podstawowe testy statystyczne i ANOVA
    • Liniowe modele, Regresja liniowa wielu zmiennych
    • Uogólnione modele regresji, regresja logistyczna
    • Diagnostyka modelu, reszty, porównanie modeli
    • Szeregi czasowe w R, modele ARIMA, VAR
  4. Wybrane metody uczenia maszynowego
    • Stres testy modelu finansowego w Excel
    • Klastrowanie, algorytm k-means, uczenie bez nadzoru
    • Klasyfikacja, drzewa decyzyjne, random forests
    • Sieci neuronowe
    • Ewaluacja modelu, CV, Bootstrap, tuningowanie modeli

Wizualizacja danych i powtarzalne analizy w R

  1. Podstawowe wykresy wizualizacji danych
    • Tworzenie wizualizacji w R, różne podejścia
    • Parametry graficzne, funkcje wysokiego poziomu, formatowanie
    • Wykres, liniowy, histogram, pudełkowy, rozrzutu
    • Pakiety do wizualizacji ggplot2, lattice, grid
    • Powtarzalne analizy z LaTeX, knitr i Rmarkdown
    • Dynamiczne dokumenty i prezentacje z Rmarkdown

Rodzina produktów Microsoft R

  1. Pakiety i udogodnienia dystrybucji Microsoft R Open
    • Kompatybilność R Open, R Server oraz R
    • Obliczenia równoległe z bibliotekami do obliczeń matematycznych
    • Reproduktywność wyników z R Open
    • Zarządzanie wersjami pakietów w czasie
  2. Pozostałe produkty z rodziny Microsoft R
    • Microsoft R Server – rozwiązanie problemu braku pamięci RAM
    • Microsoft R Client – wysoka wydajność w data science
    • SQL Server R Services – platforma do rozwoju inteligentnych aplikacji

Plan Szkolenia

Plan jest pusty

Instruktorzy


Zapytaj o szkolenie

Jestem zainteresowany/a

Podaj wynik działania:


 

Zapytaj o szkolenie zamknięte

Jestem zainteresowany/a

Podaj wynik działania:


 

Zapytaj o szkolenie otwarte
 

Jestem zainteresowany/a

Podaj wynik działania:


 

Zapytaj o ścieżkę szkoleniową
 

Rodzaj ścieżki:

Preferowany tryb szkolenia:

DziennyPopołudniowyWeekendowy

Podaj wynik działania:


 
Szybki kontakt