Python-Tutorials: Übersicht
  Demo-PYx: Machine Learning mit Python

Die Tutorial-Reihe rund um das Thema Machine Learning mit Python gibt einen praktisch orientierten Überblick über die wichtigsten Methoden und Tools des Machine Learning, sowie einen Einstieg in die Programmiersprache Python und die erforderlichen Python-Pakete für Datenanalyse und Maschinelles Lernen: NumPy, Matplotlib, Pandas, Scikit-Learn, Keras, Tensorflow.

Übersichtsartikel: Maschinelles Lernen - Konzepte, Methoden, Tools

Machine Learning-Modelle und Algorithmen haben im weitesten Sinne das Ziel, aus Input-Daten sinnvolle Zusammenhänge zu erkennen und daraus Regeln abzuleiten. Z.B. Objekte erkennen, Vorhersagen treffen, Trends erkennen, Daten nach bestimmten Kriterien gruppieren.

Der Übersichts-Artikel Maschinelles Lernen: Konzepte, Methoden, Tools bietet eine vereinfachte Übersicht über die wichtigsten Methoden und Tools des Machine Learning, sowie Hinweise über die Verwendung der elab2go-Demonstratoren, die diese illustrieren.

Das Diagramm "Machine Learning mit Python" zeigt eine Übersicht der wichtigsten Modelle des Maschinellen Lernens, gruppiert nach Art des Lernverfahrens, sowie die Python-Pakete und Klassen, mit denen sie jeweils implementiert werden, und die elab2go-Demonstratoren, die sie veranschaulichen.

Übersicht: Machine Learning mit Python
Machine Learning mit Python-Übersicht

Python Tutorial

Demo-PY1: Python-Tutorial - Der Einstieg mit Jupyter Notebookbietet einen Einstieg in die Programmiersprache Python. Die grundlegende Syntax wird im ersten Teil vorgestellt (Variablen und Datentypen, Operatoren, Datenstrukturen, Verzweigungen und Schleifen, Funktionen, objektorientierte Programmierung mit Klassen). In Teil 2: Python Paketmanagement wird das Installieren und Verwenden von Paketen mittels der Paketverwaltungssysteme pip und conda erklärt. Teil 3: Python Bibliotheken gibt einen Einstieg in die wichtigsten Python-Bibliotheken für Machine Learning. Dieses Tutorial eignet sich auch für Umsteiger, die bisher mit C-ähnlichen Sprachen oder MATLAB programmiert haben: die Gemeinsamkeiten und Unterschiede zwischen den Sprachen werden hervorgehoben und in einem letzten Abschnitt zusammengefasst.

Jupyter Notebook verwenden

Demo-PY1: Jupyter Notebook verwenden zeigt, wie man interaktive Jupyter Notebook-Skripte mit Markdown-Zellen und Codezellen erstellt. Jupyter Notebook ist eine webbasierte Umgebung, die das Erstellen, Dokumentieren und Teilen von Python- und R-Demonstratoren im Umfeld des Maschinellen Lernens unterstützt. Wir verwenden in dieser Tutorial-Reihe Jupyter Notebook, damit die Machine Learning-Modellierung in einfache Schritte mit sichtbaren dokumentierten Zwischenergebnissen heruntergebrochen werden kann.

Jupyter Widgets erstellen

Demo-PY1: Jupyter Widgets erstellen zeigt, wie man in ein Jupyter Notebook sogenannte Widgets einbaut und damit grafische Benutzeroberflächen für die Datenvisualisierung erstellt. Jupyter Widgets können entweder explizit als Steuerelemente mit Eventhandling eingefügt, oder implizit durch die interact()- oder interactive-Funktionalität generiert werden.

Datenverwaltung und - Visualisierung mit Pandas

Demo-PY2: Datenverwaltung und - Visualisierung mit Pandas zeigt am Beispiel eines Stromverbrauch-Datensatzes der Plattform Open Power System Data wie die Datenstrukturen und Funktionen der Python-Pakete Pandas und Matplotlib zur Datenaufbereitung und graphischen Darstellung großer Zeitreihen-Daten verwendet werden.

Clusteranalyse mit scikit-learn

Demo-PY3: Clusteranalyse mit scikit-learn zeigt am Beispiel eines Mini-Datensatzes mit Raumklima-Messungen, wie eine Clusteranalyse mit Hilfe der Python-Bibliothek Scikit-Learn für maschinelles Lernen durchgeführt wird.

Demo-PY3: Clusteranalyse "Automotive in 3D" zeigt einen Anwendungs­fall der Clustera­nalyse im 3-dimensionalen Raum anhand des Automobildatensatzes, der in den Predictive Maintenance-Datenanalysen Demo-PY4 und Demo4 verwendet wird. Die Cluster werden auf Basis von drei Merkmalen des Datensatzes erstellt, die am stärksten zum Ausfall beigetragen haben.

Predictive Maintenance mit scikit-learn

Demo-PY4: Predictive Maintenance mit scikit-learn zeigt, wie eine Ausfall-Prognose im Rahmen eines Predictive Maintenance-Szenarios mit Hilfe des Entscheidungsbaum-Verfahrens der Python-Bibliothek scikit-learn für maschinelles Lernen durchgeführt wird. Wir verwenden denselben Automobildatensatz, der in den Demos des Predictive Maintenance-Zyklus verwendet wird: eine csv-Datei automotive_data.csv mit 136 Beobachtungen. Die Fragestellung lautet: "Bei welcher Kombination von Merkmalen tritt ein Ausfall ein?".

Machine Learning-Modellierung mit Keras und Tensorflow

Demo-PY5: Machine Learning-Modellierung mit Keras und Tensorflow zeigt die Erstellung und Verwendung eines Künstlichen Neuronalen Netzwerks für die Zeitreihenprognose von Stromverbrauchsdaten mit Hilfe der Python-Bibliotheken Keras und Tensorflow.



Autoren, Tools und Quellen

Mit Beiträgen von:
 Prof. Dr. Eva Maria Kiss
 M. Sc. Anke Welz

Tools
Python, Anaconda, Jupyter Notebook

elab2go-Links