
Projekty Analityczne w R & RStudio
Szkolenia otwarte
3200 PLN
Szkolenia zamknięte
Cena ustalana indywidualnie
O szkoleniu
W trakcie szkolenia uczestnicy zdobędą wiedzę o zarządzaniu, projektowaniu, wykonywaniu i dokumentowaniu dobrego projektu analitycznego w środowisko R oraz RStudio. Główny nacisk tego szkolenia położony został na organizację, pracę grupową, wersjonowanie, powtarzalne analizy oraz dokumentowanie projektów analitycznych w RStudio. Dzięki temu szkoleniu zdobędziesz aktualną i poszukiwaną wiedzę o pracy nad projektami analitycznymi w R.
Szkolenie prowadzone jest metodą Live script, co oznacza, że cały czas poświęcony został na pracę w środowisku R i RStudio. W trakcie omawiania kolejnych tematów najpierw pracujesz wspólnie z trenerem a następnie w trakcie ćwiczeń utrwalasz sobie zdobytą wiedzę. Zwieńczeniem szkolenia jest projekt analityczny, który stworzysz od początku do końca wspólnie z trenerem.
Dla kogo jest to szkolenie?
Szkolenie skierowane jest do osób które chcą przejśc od analiz ad hoc do uporządkowanych, powtarzalnych i dobrze zaplanowanych analiz w R. W szczególności szkolenie odpowiada na potrzeby profesjonalnych badaczy, analityków, deweloperów i menadżerów którzy pracują lub dopiero chcą zacząć pracować w R i RStudio.
Czego się nauczę?
- Po ukończeniu szkolenia, uczestnik będzie potrafił:
- Organizować projekt analityczny w R z pomocą RStudio
- Zarządzać projektem analitycznym
- Zarządzać wersjami projektu z pomocą Git
- Importować dane do projektu z wielu różnych źródeł
- Przygotowywać dane do analizy
- Tworzyć przejrzyste i efektywne skrypty do powtarzalnych analiz
- Tworzyć automatyczne raporty i prezentacje z pomocą R Markdown, LaTeX
- Tworzyć pakiety a następnie udostępniać je wewnątrz organizacji
Plan szkolenia
- Organizacja projektu analitycznego
- Koncepcja projektu analitycznego
- Definicja projektu i planowanie
- Wykonanie projektu
- Monitorowanie i kontrola
- Zamknięcie projektu
- Dlaczego R i RStudio?
- Wprowadzenie do R
- Podstawy języka
- Obiekty
- Indeksowanie
- Funkcje
- Import danych
- Pamięc robocza
- Pakiety
- Wprowadzenie do RStudio
- Przegląd możliwości RStudio
- Pisanie skryptów w RStudio
- Edytowanie skryptów
- Nawigacja, sekcje i zwijanie kodu
- Zaawansowane możliwości RStudio
- Tworzenie pakietów
- Tworzenie dokumentacji
- Diagnozowanie błędów
- Debugowanie kodu
- Zarządzanie projektami w RStudio
- Środowisko projektów w RStudio
- Tworzenie projektu
- Struktura folderów i plików
- Kontrola wersji GIT i Subversion
- Praca zespołowa nad projektem w RStudio
- Narzędzia raportowania
- Zarządzanie kontekstowe
- Zarządzanie pakietami i zależnościami – packrat
- Dobre praktyki
- Pliki – dostęp przechowywanie, wersjonowanie
- Przechowywanie danych w chmurze Dropbox
- Przechowywanie danych w chmurze GitHub
- Dostęp do plików
- Wersjonowanie
- RStudio i Git
- Organizacja i zarządzanie danymi do analizy
- Organizacja procesu ładowania danych
- Importowanie danych zapisanych lokalnie
- Importowanie danych zapisanych w bazie
- Importowanie danych ze żródeł Internetowych
- Automatyzacja procesu ładowania danych
- Przygotowanie danych do analizy
- Od danych surowych do danych poprawnych technicznie
- Przekształcanie wymiaru danych
- Zmiana nazw zmiennych/tworzenie nowych
- Porządkowanie obserwacji
- Filtrowanie obserwacji i zmiennych
- Przetwarzanie danych tekstowych
- Zmiana klas zmiennych
- Łączenie zbiorów danych
- Od danych poprawnych technicznie do zgodnych danych
- Brakujące obserwacje
- Odstające obserwacje
- Niezgodności w danych
- Korekta danych
- Imputacje danych
- Od danych surowych do danych poprawnych technicznie
- Powtarzalne analizy – wprowadzenie
- Cykl produkcji powtarzalnych analiz
- Podstawy knitr i rmarkdown
- Rozszerzenia plików
- Łączenie bloków kodu z tekstem
- Hooks
- Integracja knitr i markdown w RStudio
- Dobre praktyki
- Analizy i wyniki
- Prezentacja kodu i wyników
- R Markdown, knitr, LaTeX, Beamer, HTML
- Łączenie tekstu z wynikami obliczeń
- Prezentacja wyników w formie tablearycznej
- Tablice LaTeX, HTML
- Integracja wykresów i grafik
- Wykresy z ggplot2, googleVis
- Prezentowanie wyników z knitr i LaTeX
- Podstawy Latex
- Sekcje, rozdziały
- Matematyka
- Listy, wypunktowanie
- Bibliografia z BibTeX
- Tworzenie raportów i prezentacji z knitr i LaTeX
- Tworzenie dużych raportów w LaTeX
- Tworzenie dużych raportów w knitr
- Łączenie dokumentów
- Prezentacje w LaTeX Beamer
- Prezentowanie wyników w sieci Web z R Markdown
- Podstawy R Markdown
- Edytory R Markdown
- Sekcje, rozdziały, paragrafy
- Linki, specjalne znaki
- Listy, wypunktowanie
- CSS i Markdown
- Tworzenie raportów i prezentacji z R Markdown
- Tworzenie dużych raportów z R Markdown w HTML
- Prezentacje HTML w R Markdown
- Prezentacje LaTeX Beamer w R Markdown
- Publikowanie
- Wprowadzenie do tworzenia pakietów w RStudio
- Podstawy i niezbędne elementy
- Struktura pakietu
- Analiza składowych pakietów
- Cykl produkcji pakietu
- Tworzenie struktury folderów
- Budowa własnego pakietu
- Testowanie