Einführung in den Kurs
  • Willkommen im Kurs
  • Hinweise zum Kurs
  • Kurs Übersicht
  • Kursmaterialien
  • Häufig gestellte Fragen
  • Big Data Übersicht
  • Spark Übersicht
Alternative 1: Lokale Spark + Python Installation
  • Willkommen zur lokalen PySpark Einrichtung
  • Windows - PySpark Installation
  • Mac + Linux - Häufige Probleme bei der Installation mit Mac und Linux
  • MAC- Lokale Python Installation
  • MAC - Lokale PySpark Installation
  • Linux - Lokale PySpark Installation
  • Python Crashkurs
Python Crashkurs
  • Einführung in den Python Crashkurs
  • Jupyter Notebook Übersicht
  • Python Crashkurs Teil 1
  • Python Crashkurs Teil 2
  • Python Crashkurs Teil 3
  • Python Crashkurs Teil 4
  • Python Crashkurs Übungen
  • Python Crashkurs Übungen - Lösungen
Spark DataFrame Grundlagen
  • Willkommen zu den DataFrames
  • Einführung in DataFrame Grundlagen
  • Spark DataFrame Grundlagen Teil 1
  • Spark DataFrame Grundlagen Teil 2
  • Spark DataFrame Operationen
  • GroupBy
  • Fehlende Werte
  • Timestamps
Spark DataFrame Projekt Übung
  • Willkommen zum Übungsprojekt
  • DataFrame Projekt Aufgabe
  • DataFrame Projekt Lösungen
  • Spark DataFrames Beratungsprojekt - Aufgabe
  • Spark DataFrames Beratungsprojekt - Lösungen
Einführung in Machine Learning mit MLlib
  • Willkommen zum Machine Learning Abschnitt
  • Machine Learning Einführung
  • Einführung in Machine Learning und ISLR
  • Machine Learning mit Spark und Python mit MLlib
  • Machine Learning Quiz
Lineare Regression
  • Lineare Regression Theorie
  • Wiederholung: Daten und Funktionen
  • Lineare Regression Dokumentation Beispiel
  • Regression Evaluierung
  • Lineare Regression Beispiel Code Along
  • Lineare Regression Beratungsprojekt Aufgabe
  • Lineare Regression Beratungsprojekt Aufgabe - Lösungen
Logistische Regression
  • Logistische Regression Theorie
  • Logistische Regression Dokumentation Beispiel
  • Logistische Regression Code Along
  • Logistische Regression Beratungsprojekt
  • Logistische Regression Beratungsprojekt - Lösungen
Entscheidungsbäume und Random Forests
  • Entscheidungsbäume Einführung
  • Baum Methoden Dokumentationsbeispiel
  • Baum Methoden Code Along - Teil 1
  • Baum Methoden Code Along - Teil 2
  • Baum Methoden Beratungsprojekt Aufgabe
  • Baum Methoden Beratungsprojekt Aufgabe - Lösung
K-means Clustering
  • K-Means-Clustering Einführung
  • K-Means-Clustering Dokumentationsbeispiel
  • K-Means-Clustering Code Along
  • K-Means-Clustering Beratungsprojekt - Aufgabe
  • K-Means-Clustering Beratungsprojekt - Aufgabe - Lösungen
Empfehlungssysteme
  • Einführung in Empfehlungssysteme
  • Empfehlungssysteme - Code Along Projekt
Natural Language Processing
  • Natural Language Processing Einführung
  • NLP Tools - Teil 1
  • NLP Tools - Teil 2
  • NLP Tools - Teil 3
  • Natural Language Processing Beispiel
Spark Streaming with Python
  • Willkommen zum Spark Streaming Abschnitt
  • Einführung zu Streaming mit Spark
  • Netcat auf Windows
  • Spark Streaming Beispiel Code
  • Twitter Account Einrichten
  • Spark Streaming Twitter Project - Teil 1
  • Spark Streaming Twitter Project - Teil 2
  • Spark Streaming Twitter Project - Teil 3
  • Spark Streaming Twitter Project - Teil 4
Bonus: RDD Einführung
  • Lambda Expressions (Ausdrücke) Wiederholung
  • RDD Transformations und Actions - Teil 1
  • RDD Transformations und Actions - Teil 2
  • RDD Transformations und Actions - Teil 3
Alternative 2: AWS PySpark Installation
  • AWS Account Einrichtung
  • Kurze Notiz zur AWS Sicherheit