
R od podstaw
Szkolenia otwarte
2 600 PLN
Szkolenia zamknięte
Cena ustalana indywidualnie
O szkoleniu
R jest obecnie jednym z najpopularniejszych narzędzi stosowanych do analizy danych. Jest to równocześnie język programowania, który pozwala na tworzenie skryptów automatyzujących analizę danych. Z pomocą R można tworzyć własne funkcje, przeprowadzać skomplikowane obliczenia, transformacje, analizy statystyczne, budować modele ekonometryczne, tworzyć piękne wykresy a nawet zautomatyzować raport analityczny.Dzięki dużej liczbie osób zaangażowanych w rozwój R liczba zastosowań i dostępnych metod statystycznych ciągle rośnie. R jest program darmowym i jedyną aplikacją, która oferuje dostęp do najnowszych osiągnięć nauki w zakresie metod statystycznych. Na chwilę obecną ogromna liczba instytutów, firm, banków oraz uczelni korzysta z R do analizy danych.
Dla kogo jest to szkolenie?
Szkolenie skierowane jest przede wszystkim do osób chcących zacząć korzystać z R:
- Studentów
- Analityków
- Konsultantów
- Menadżerów
- Statystyków
Czego się nauczę?
Po ukończeniu szkolenia, uczestnik będzie potrafił:
- Korzystać z R oraz RStudio
- Przetwarzać dane
- Importować dane z plików XLS, CSV, SAS, SPSS
- Wykorzystywać R do analiz statystycznych
- Tworzyć powtarzalne analizy
- Budować pętle i warunkować wykonanie automatyzując prace
- Tworzyć ładne wykresy
Plan szkolenia
Moduł I – Środowisko R
- Rozpoczynamy pracę z R
- Konfiguracja R
- Konfiguracja IDE dla R – RStudio
- Przegląd funkcjonalności środowiska
- Tworzenie projektu
- Tryby pracy w R: skryptowy, interaktywny
- Korzystanie z pomocy i poszukiwanie rozwiązań
- Zarządzanie plikami i folderami
- Biblioteki – zarządzanie repozytoria
- Korzystanie ze skrótów klawiaturowych
- Ćwiczenia
- Podstawy składni języka
- Wyrażenia
- Bloki
- Komentarze
- Keywords
- Atomiczne typy danych: numeric, string etc
- Ćwiczenia
- Operatory
- Arytmetyczne
- Relacji
- Logiczne
- Przypisania
- Ćwiczenia
- Podstawowe obiekty danych
- Przegląd obiektów w R do zapisywania danych
- Skalary i wektory – tworzenie, łączenie, obliczenia
- Macierze i tablice, tworzenie, łączenie, obliczenia
- Factory – tworzenie, manipulacje
- Listy – tworzenie, agregacja, manipulacje
- Data frame – tworzenie, łączenie, manipulacje
Moduł II – Podstawy programowania w języku R
- Konstrukcje warunkowe i kontrola wykonania
- Składnia dla konstrukcji if else
- Switch
- Wektoryzowane ifelse
- Zagnieżdżone if else
- Pętle
- Składnia dla pętli w R for
- Pętla while
- Kontrola pętli z break oraz next
- Funkcje
- Składnia dla funkcji
- Wywołanie i argumenty
- Zagnieżdżone funkcje
- Funkcje anonimowe
- Programowanie funkcyjne
- Rodzina funkcji apply i zastosowanie
- Rodzina funkcji map z pakietu purr
- Safely oraz possible do zarządzania błędami
- Debugowanie kodu
- Informacja o błędzie – traceback, print, browser
- Debugowanie z RStudio
- Kontrola wersji kodu – zarządzanie i utrzymanie
- Integracja RStudio z Git i GitHub
- Podstawy Git – Repo, commit, diff, tab
- Wzorce pracy z Git dla utrzymania kodu
Moduł III – Wykorzystanie R w analizie danych
- Łączenie z danymi w R
- Import/export z plików płaskich
- Łączenie i praca z bazą danych
- Przetwarzanie danych – tidyverse
- Wyodrębnianie danych – subskrypty i indeksy
- Filtrowanie danych
- Agregacja danych
- Tworzenie zmiennych
- Wykonywanie operacji na grupach
- Zamiana typów danych
- Duże zbiory danych
- Wykresy – ggplot2
- Podstawowe wykresy dla 1 zmiennej
- Podstawowe wykresy dla wielu zmiennych
- Parametry graficzne
- Zapisywanie wykresów w formatach png, jpg, pdf
- Inne wykresy – korelogram, heatmapa
- Elementy statystyki w R
- Statystyka opisowa
- Rozkłady prawdopodobieństwa
- Korelacja
- ANOVA
- Tesy statystyczne
- Regresja liniowa
- Diagnostyka regresji
Moduł IV – Wykorzystanie R w projektach analitycznych
- Workflow projektu
- Organizacja plików i podział na zadania
- Rozwiązanie w formie projektu
- Zarządzanie skryptami
- Wersjonowanie i kolaboracja
- Powtarzalne analizy
- Projekty w RStudio
- Knitr/rmarkdown – tworzenie dokumentacji analizy
- Eksportowanie wyników do prezentacji, PDF i docx
- Dobre praktyki
- Jak nazywać pliki, obiekty itp.
- Zarzadzanie ustawieniami startowymi R
- Zarządzanie bibliotekami i wersjami
- Case Study – Rozwiązujemy projekt analityczny
- Definiujemy problem do rozwiązania
- Ustawiamy projekt i repozytorium
- Dzielimy zadania i kodujemy
- Budujemy raport z analizy