Samen leer je beter dankzij mijn workshop Data Science met Python en Spark. Wil je meer weten over deze workshop? Benieuwd hoe ik 'm kan aanpassen naar jouw wensen? Andere vraag? Stuur me vooral een bericht.
Samen leer je beter dankzij mijn workshop Data Science met Python en Spark. Wil je meer weten over deze workshop? Benieuwd hoe ik 'm kan aanpassen naar jouw wensen? Andere vraag? Stuur me vooral een bericht.
Apache Spark is een open source gedistribueerde engine voor het opvragen en verwerken van data. In deze driedaagse hands-on workshop leer je hoe je Spark vanuit Python (PySpark) kunt gebruiken om grote hoeveelheden data te verwerken.
Na een overzicht van de Spark architectuur, beginnen we met het manipuleren van Resilient Distributed Datasets (RDD’s) om vervolgens de overstap te maken naar Spark DataFrames. Het concept van lazy evaluation wordt in detail besproken en we demonstreren verschillende transformaties en acties die specifiek zijn voor RDD’s en DataFrames. Je leert hoe DataFrames kunnen worden gemanipuleerd met behulp van SQL query’s.
We laten je zien hoe je supervised machine learning algoritmen toepast, zoals lineaire regressie, logistische regressie, beslisbomen en random forests. Je leert ook over unsupervised machine learning algoritmen zoals PCA en K-means clustering.
Aan het einde van deze workshop heb je een goed begrip van het verwerken van data met PySpark en begrijp je hoe je Spark’s machine learning-bibliotheek kunt gebruiken om verschillende machine learning-modellen te bouwen.
Dag 1:
Dag 2:
Dag 3:
Er wordt verwacht dat je bekend bent met de volgende Python-syntaxis en -concepten:
bool
, int
, float
, list
, tuple
, dict
, str
, type castingin
operator, indexing, slicingif
, elif
, else
, for
, while
range()
, len()
, zip()
def
, (keyword) arguments, default valuesimport
, import as
, from import ...
Enige ervaring met Pandas en SQL is handig, maar niet vereist.
Deelnemers wordt vriendelijk verzocht om voor aanvang van de workshop de volgende zaken te installeren:
docker pull jupyter/pyspark-notebook
Na aanmelding ontvangt je per e-mail meer gedetailleerde installatie-instructies.
Blijf op de hoogte van nieuwe workshops, aankomende evenementen en ander nieuws over mijzelf en Data Science Workshops.
Wil je meer weten over deze workshop? Benieuwd hoe ik 'm kan aanpassen naar jouw wensen? Andere vraag? Stuur een e-mail naar jeroen