ProgramowanieR

Programowanie i Analiza Danych w Microsoft R Open

18 - 23 lip 2024

Online

3 350,00 zł netto / osobę
Nie pasuje Ci żaden termin? Napisz do nas!
Zapisz więcej osób

Taniej w grupie

  • 3 osoby - 10% zniżki
  • 4 osoby - 15% zniżki
  • 5 osób - 20% zniżki
  • 6 osób - 25% zniżki
  • 7 osób - 30% zniżki
  • O szkoleniu

    Microsoft R Open wcześniej znany jako Revolution R Open to wzbogacona dystrybucja R, 9 najpopularniejszego języka programowania na świecie, przez Microsoft. Rosnąca popularność i ogromny potencjał w zastosowaniach data science skłoniły giganta z Redmond do przygotowania własnej dystrybucji i wzbogacenia jej o kilka przydatnych funkcji takich jak przetwarzanie równoległe kodu za pomocą nowych pakietów do obliczeń czy narzędzia do tworzenia powtarzalnych wyników.

    Szkolenie Programowanie i Analiza Danych w Microsoft R Open obejmuje programem wprowadzenie do programowania w języku R, analizę danych, wizualizację oraz wprowadzenie do nowych funkcji oferowanych wyłącznie przez dystrybucję Microsoft R Open.

    Dla kogo jest to szkolenie?

    Z uwagi na niezależność języka R od dystrybucji szkolenie to jest dedykowane wszystkim którzy chcą się nauczyć programować w R, analizować dane oraz poznać dodatkowe funkcje i pakiety oferowane przez dystrybucję Microsoft R Open.

    Czego się nauczę?

    Po ukończeniu szkolenia, uczestnik będzie potrafił:

    • Interpretować i modyfikować programy napisane w R
    • Pisać programy w R, tworzyć przejrzyste skrypty do analiz
    • Tworzyć funkcje do rozwiązywania powtarzalnych problemów
    • Importować dane na potrzeby analiz z plików i baz danych
    • Przetwarzać i manipulować dane korzystając z różnych pakietów
    • Prognozować, klasyfikować, wykrywać odstające obserwacje
    • Korzystać z algorytmów maszynowego uczenia, tuningować
    • Tworzyć dynamiczne raporty analityczne z Rmarkdown
    • Korzystać z udogodnień dystrybucji Microsoft R Open
    1. Wprowadzenie
    • Jak działa R – Program i ewaluacja
    • Pierwsza sesja w R, interaktywnie i wsadowo
    • Zintegrowane środowisko programistyczne Rstudio
    • Przegląd podstawowych obiektów i struktur danych
    • Przykład skryptu do analizy regresji liniowej krok po kroku
    • Wyszukiwanie pomocy, funkcje, pakiety i obiekty
    • Pakiety w R, instalacja, budowa i ładowanie do pamięci
    2. Podstawy języka R
    • Podstawowe obliczenia matematyczne i operatory
    • Zasady tworzenia nazw dla obiektów w R i Namespaces
    • Specjalne obiekty liczbowe, liczby, wartości logiczne i tekstowe
    • Klasy obiektów, testowanie i zarządzanie klasami obiektów
    • Pamięć robocza dla obiektów
    3. Podstawy programowania w R
    • Skrypty, tworzenie, modyfikowanie i praca projektowa w R
    • Od poleceń do funkcji i programowania funkcyjnego
    • Pakiety, instalacja zarządzanie i wersjonowanie
    • Debugowanie kodu w skrypcie czyli jak znaleźć błędy i je rozwiązać
    • Błędy i ostrzeżenia, Interaktywne śledzenie błędów
    4. Obiekty danych w R
    • Wektory –tworzenie, modyfikacja, przydatne funkcje, indeksowanie
    • Macierze i Tablice – tworzenie, zarządzanie indeksowanie, obliczenia
    • Listy – tworzenie list, atomowe i rekursywne elementy, indeksowanie
    • Data Frame – tworzenie tablic, manipulacje, indeksowanie i nazwy
    • Faktory –poziomy, zastosowanie, uporządkowane faktory
    5. Struktury programistyczne w R
    • Konstrukcje warunkowe if else, wektoryzacja if, wielokrotny wybór
    • Pętle typu repeat, while, for, replikacja,
    • Funkcje z rodziny apply dla optymalizacji wykonania pętli
    • Wektoryzacja kodu i przyspieszenie wykonania kodu
    • Symulacje w R, generowanie liczb losowych
    • Funkcje, wartości domyślne dla parametrów, tworzenie, wywoływanie
    • Środowisko funkcji i zasięg, hierarchia, namespaces
    6. Obiekty tekstowe, wyrażenia regularne
    • Obliczenia tekstowe, podstawowe funkcje do pracy z tekstem
    • Wyrażenia regularne, manipulacje, importowanie
    • Przetwarzanie tekstu na macierz do postac TF, TFIDF
    1. Import Eksport Danych w R
    • Wbudowane źródła danych z pakietów
    • Wczytywanie plików tesktowych, TAB, CSV, XML, HTML
    • Wczytywanie plików binarnych, XLSX, SAS, STATA,SPSS, MATLAB
    • Dane ze stron internetowych, automatyzacja zczytywania stron w R
    • Łączenie i pobieranie danych z bazy danych, korzystanie z SQL w R
    • Eksportowanie wyników i danych do innych plików
    2. Przygotowanie danych do analizy
    • Łączenie danych i usuwanie duplikatów wartości
    • Czyszczenie danych i zmiana typu zmiennych, kształtu
    • Manipulacje tablicami danych, zmiana nazw, obserwacji
    • Wartości brakujące i nietypowe – wykrywanie, usuwanie, imputacja
    • Dodatkowe funkcje z pakietów dplyr, data.table, aggregate reshape2
    • Standaryzacja danych i normalizacja
    3. Eksploracja, Rozkłady, Modelowanie danych
    • Statystyki opisowe, korelacja i kowariancja
    • Rozkłady prawdopodobieństwa, generowanie liczb losowych
    • Podstawowe testy statystyczne i ANOVA
    • Liniowe modele, Regresja liniowa wielu zmiennych
    • Uogólnione modele regresji, regresja logistyczna
    • Diagnostyka modelu, reszty, porównanie modeli
    • Szeregi czasowe w R, modele ARIMA, VAR
    4. Wybrane metody uczenia maszynowego
    • Stres testy modelu finansowego w Excel
    • Klastrowanie, algorytm k-means, uczenie bez nadzoru
    • Klasyfikacja, drzewa decyzyjne, random forests
    • Sieci neuronowe
    • Ewaluacja modelu, CV, Bootstrap, tuningowanie modeli
    1. Podstawowe wykresy wizualizacji danych
    • Tworzenie wizualizacji w R, różne podejścia
    • Parametry graficzne, funkcje wysokiego poziomu, formatowanie
    • Wykres, liniowy, histogram, pudełkowy, rozrzutu
    • Pakiety do wizualizacji ggplot2, lattice, grid
    • Powtarzalne analizy z LaTeX, knitr i Rmarkdown
    • Dynamiczne dokumenty i prezentacje z Rmarkdown
    1. Pakiety i udogodnienia dystrybucji Microsoft R Open
    • Kompatybilność R Open, R Server oraz R
    • Obliczenia równoległe z bibliotekami do obliczeń matematycznych
    • Reproduktywność wyników z R Open
    • Zarządzanie wersjami pakietów w czasie
    2. Pozostałe produkty z rodziny Microsoft R
    • Microsoft R Server – rozwiązanie problemu braku pamięci RAM
    • Microsoft R Client – wysoka wydajność w data science
    • SQL Server R Services – platforma do rozwoju inteligentnych aplikacji