Wprowadzenie do Apache Spark

Wprowadzenie do Apache Spark

Szkolenia otwarte

1500 PLN

- Szkolenie, w którym uczestniczą osoby z różnych firm
- Plan szkolenia taki, jak przedstawiony na stronie
- Małe grupy szkoleniowe, 3-10 osób

Szkolenia zamknięte

Cena ustalana indywidualnie

- Szkolenie realizowane na indywidualne zamówienie
- Termin i miejsce szkolenia ustalamy indywidualnie
- Plan szkolenia dostosowany do potrzeb firmy

O szkoleniu

Apache Spark to platforma klastrowego przetwarzania danych w szczególności tych określanych mianem Big Data. Spark w przeciwieństwie do Hadoop wykorzystuje przetwarzanie danych w koncepcji in-memory co sprawia że jest wydajniejszy i świetnie sprawdza się na dużych zbiorach danych.

Szkolenie wprowadzenie do platformy Spark przedstawia podstawy pracy na dużych zbiorach danych. W programie zaprezentowane zostały najważniejsze elementy projektu Spark w tym między innymi API, podstawowe narzędzia jak SQL, możliwości streamingu czy wykorzystania Spark w maszynowym uczeniu.

Dla kogo jest to szkolenie?

Szkolenie zostało zaprojektowane jako praktyczne wprowadzenie i przegląd możliwości Apache Spark. Grupą docelową szkolenia są inżynierowie danych analitycy, inżynierowie oprogramowania, menadżerowie IT oraz data scientists którzy dostrzegają potrzebę i korzyści płynące z wykorzystania technologii Spark do analizy danych.

Czego się nauczę?

  • Zidentyfikujesz możliwości i potencjał Spark które mogą przynieść korzyści w twojej organizacji
  • Poznasz terminologię i technologie powiązane bezpośrednio z Apache Spark
  • Nauczysz się pracować z danymi tworząc zapytania na dużych zbiorach danych wykorzystując Spark SQL oraz DataFrames
  • Przetworzysz i zmodyfikujesz zadania typu ETL korzystając z API Spark, DataFrames oraz Resilient Distributed Datasets(RDD)
  • Nauczysz się korzystać z interfejsu administratora
  • Znajdziesz odpowiedzi na nurtujące Cię pytania i dowiesz się gdzie szukać pomocy

Plan szkolenia

  1. Przegląd technologii Spark
    • Czym jest Apache Spark
    • Dlaczego Spark?
    • Szanse i korzyści
    • Komponenty Spark vs Hadoop
  1. Podstawy Spark
    • Środowisko Spark
    • Korzystanie z shell Spark
    • Resilient distributed datasets RDD
    • Programowanie funkcyjne w Spark
  1. Podstawy RDD
    • Struktura i tworzenie RDD z plików
    • Transformacje, operacje, przekształcenia danych
    • Key-Value RDD
    • Interaktywne zapytania z użyciem RDD
  1. DataFrames oraz Spark SQL
    • Tworzenie DataFrames
    • Tworzenie zapytań na DataFrames i wykorzystanie Spark SQL
    • Caching
    • Generowanie raportów
  1. Wykonywanie zadań przez Spark
    • Directed acyclic Graph
    • Partitions and Shuffles
    • Wydajność, wykorzystanie pamięci
  1. Streaming
    • Źródła i zadania
    • Tworzenie Dstreams ze źródeł, API
    • Operacje na Dstream
  1. Podstawy Machine Learning w Spark MLib
    • Podstawy ML z interfejsem Spark
    • Przykład maszynowego uczenia z Spark MLib

Plan Szkolenia

Plan jest pusty

Instruktorzy


Zapytaj o szkolenie

Jestem zainteresowany/a


 

Zapytaj o szkolenie zamknięte

Jestem zainteresowany/a


 

Zapytaj o szkolenie otwarte
 

Jestem zainteresowany/a


 
Szybki kontakt