Apache Spark to platforma klastrowego przetwarzania danych w szczególności tych określanych mianem Big Data. Spark w przeciwieństwie do Hadoop wykorzystuje przetwarzanie danych w koncepcji in-memory co sprawia że jest wydajniejszy i świetnie sprawdza się na dużych zbiorach danych.
Szkolenie wprowadzenie do platformy Spark przedstawia podstawy pracy na dużych zbiorach danych. W programie zaprezentowane zostały najważniejsze elementy projektu Spark w tym między innymi API, podstawowe narzędzia jak SQL, możliwości streamingu czy wykorzystania Spark w maszynowym uczeniu.