Data Science & Maschinelles Lernen in Python - am Beispiel
Wenn du mich unterstützen möchtest: Wenn du den Kurs über den Link von mir hier kaufst, erhalte ich von Udemy eine höhere Verkaufs-Provision, als wenn der Kurs über die Platform aufgerufen und gekauft wird.
Udemy sagt mir hierbei zu, dass du den aktuell besten Preis erhälst, zu dem dieser Kurs aktuell auf dem Udemy-Marktplatz verkauft wird. Du solltest also über meinen Link nicht mehr bezahlen als wenn du den Kurs direkt über die Platform kaufst.
Das Ziel von Data Science besteht darin Wissen aus strukturierten und unstrukturierten Daten zu extrahieren. Zu diesem Zweck kommen verschiedene Methoden und Algorithmen zum Einsatz, darunter auch solche aus dem Bereich des Maschinellen Lernens. Hierbei geht es darum Muster in Trainingsdaten zu erkennen. Aus diesen Gesetzmäßigkeiten werden mithilfe von Algorithmen neue statistische Modelle gebildet, womit sich schließlich auch unbekannte Daten zuverlässig beurteilen lassen.
In diesem Kurs wird die Theorie und Anwendung der beiden Disziplinen, Data Science und Maschinelles Lernen, aufgezeigt. Dafür wird die Programmiersprache Python verwendet, wobei keine Vorkenntnisse vorausgesetzt sind. Weiter wird der Umgang mit dem Framework Apache Spark vermittelt, das eine parallele Berechnung auf mehreren Computern ermöglicht, um sehr große Datenmengen ("Big Data") verarbeiten zu können.
Mit diesen Tools und anhand von vielen praktischen Beispielen werden folgende Themen besprochen:
- Lineare und Polynomiale Regressionsanalyse
- K-Means-Algorithmus
- Hauptkomponentenanalyse
- Train/Test, Kreuzvalidierungsverfahren
- Bayes’sche Methoden
- Entscheidungsbäume, Random Forests
- Multivariante Regression
- Support Vector Machines
- Bestärkendes Lernen
- Empfehlungssystem: Kollaboratives Filtern
- K-Nächster-Nachbar
- Bias/Varianz-Dilemma
- Ensemble Lernen
- Volltextsuche mit Hilfe von TF-IDF
- AB-Tests
Alle diese Themen werden verständlich kommuniziert und so aufbereitet, dass die Teilnehmer sie nach Abschluss des Kurses für eigene Problemstellungen einsetzen können.