Zurück zur Übersicht

Data Science & Maschinelles Lernen in Python - am Beispiel

Das Ziel von Data Science besteht darin Wissen aus strukturierten und unstrukturierten Daten zu extrahieren.

Das Ziel von Data Science besteht darin Wissen aus strukturierten und unstrukturierten Daten zu extrahieren. Zu diesem Zweck kommen verschiedene Methoden und Algorithmen zum Einsatz, darunter auch solche aus dem Bereich des Maschinellen Lernens. Hierbei geht es darum Muster in Trainingsdaten zu erkennen. Aus diesen Gesetzmäßigkeiten werden mithilfe von Algorithmen neue statistische Modelle gebildet, womit sich schließlich auch unbekannte Daten zuverlässig beurteilen lassen.

In diesem Kurs wird die Theorie und Anwendung der beiden Disziplinen, Data Science und Maschinelles Lernen, aufgezeigt. Dafür wird die Programmiersprache Python verwendet, wobei keine Vorkenntnisse vorausgesetzt sind. Weiter wird der Umgang mit dem Framework Apache Spark vermittelt, das eine parallele Berechnung auf mehreren Computern ermöglicht, um sehr große Datenmengen ("Big Data") verarbeiten zu können.

Mit diesen Tools und anhand von vielen praktischen Beispielen werden folgende Themen besprochen:

  • Lineare und Polynomiale Regressionsanalyse
  • K-Means-Algorithmus
  • Hauptkomponentenanalyse
  • Train/Test, Kreuzvalidierungsverfahren
  • Bayes’sche Methoden
  • Entscheidungsbäume, Random Forests
  • Multivariante Regression
  • Support Vector Machines
  • Bestärkendes Lernen
  • Empfehlungssystem: Kollaboratives Filtern
  • K-Nächster-Nachbar
  • Bias/Varianz-Dilemma
  • Ensemble Lernen
  • Volltextsuche mit Hilfe von TF-IDF
  • AB-Tests

Alle diese Themen werden verständlich kommuniziert und so aufbereitet, dass die Teilnehmer sie nach Abschluss des Kurses für eigene Problemstellungen einsetzen können.

Zurück zur Übersicht