Demo-PY1: Python-Tutorial
Anleitung: Installation von Python und Anaconda

Die vorliegende Anleitung beschreibt die Installation und Verwendung des Tools Anaconda, als Hilfsmittel für Python-Programmierung im Rahmen des Maschinellen Lernens. Um Python-Programme schreiben zu können, muss zunächst eine aktuelle Python-Installation von der Python-Webseite python.org heruntergeladen und installiert werden. Für die Entwicklung größerer Projekte sollte zusätzlich die Paketverwaltungsplattform Anaconda eingerichtet werden, die umfangreiche Funktionalität für Paketverwaltung bereitstellt und über die weitere Tools wie Jupyter Notebook und Spyder installiert werden.

Übersicht

1 Python installieren

Auf der offiziellen Python-Webseite python.org kann Python heruntergeladen werden. Als nächstes wird das heruntergeladene Installations-Setup mit Administratorrechten (Rechtsklick auf die Setup-Datei -> „Als Administrator ausführen") ausgeführt. Die weiteren Details sind in der folgenden Diashow dargestellt:

1. Option "Add Python 3.x to PATH" anklicken und benutzer-definierte Installation ("Customize installation") auswählen.
2. Das Paketverwaltungsprogramm "pip" aktivieren.
3. Bevor die Installation von Python anfängt, wird gefragt ob man fortgeschrittene Einstellungen ändern oder annehmen will. Hierbei die Option "Add Python to environment variables" auswählen. Mit dieser Einstellung wird Python auf dem Computer global installiert.
4. Im letzten Schritt der Installation wird noch die Möglichkeit gegeben, die Zeichenlimitierung für Pfadvariablen unter Windows aufzuheben. Also auf "Disable path lenght limit" klicken.


Hinweis: Das Hinzufügen der Python-Version zur PATH-Variablen ist dann sinnvoll, wenn man nur eine Anwendung entwickelt und schnell auf die Python-Anwendungen zugreifen möchte. Arbeitet man jedoch mit mehreren Python-Versionen gleichzeitig, kann es nachteilig sein, die Python-Version in der PATH-Variablen zu hinterlegen, da ein Python-Programm, das eine bestimmte Python-Version benötigt, ggf. über die PATH-Variable die falsche Python-Version zugewiesen bekommt.

2 Python Befehlskonsole testen

Nach erfolgreicher Installation von Python testen wir die Python-Befehlskonsole. Einfach im Windows Startmenü Python auswählen, dann öffnet sich die Befehlskonsole und die installierte Python-Version wird angezeigt.

Beispiel: Einzeilige und mehrzeilige Anweisungen

3 Anaconda installieren

Anaconda ist eine multiplattform-fähige web-basierte Paketverwaltungs-Software und kann unter Windows, Linux und MacOS laufen. Je nachdem, welches System man benutzt, wird die Installation von Anaconda anders durchgeführt. Die Installation von Anaconda unter Windows wird folgendermaßen durchgeführt.
1. Anaconda von der Webseite www.anaconda.com/ herunterladen.
2. Installation durch Doppelklick auf dem heruntergeladenen Setup (.exe-Datei) starten. Sicherheitshalber sollte Anaconda mit Administratorenrechten installiert werden, damit bei der späteren Installation externer Packages keine Fehler auftreten.
3. Der Benutzerführung des Installationsprogramms folgen.


4 Anaconda testen

Nach erfolgreicher Installation von Anaconda kann der Anaconda-Navigator geöffnet und getestet werden. Die Home-Ansicht zeigt die verfügbaren Anwendungen für die ausgewählte Umgebung an, insbesondere auch Jupyter Notebook, das über den Launch-Button gestartet werden kann. Die Environments-Ansicht zeigt die verfügbaren Umgebungen (engl. environment) und Pakete (engl. packages) für die ausgewählte Umgebung an. Ein Environment bzw. eine Anwendungsumgebung ist ein in sich abgeschlossener Bereich, in den man eine Zusammenstellung zueinander passender Anwendungen und Programmpakete installieren kann. Einsteiger, die zunächst keine eigenen Environments erstellen, befinden sich im defaultmäßigen base-Environment und können zunächst darin arbeiten.

Home-Ansicht

In der Umgebung "base" haben wir Jupyter Labs, Jupyter Notebooks (für interaktive Demos) und Spyder (als Python-Entwicklungumgebung für größere Programmbibliotheken und zum Debuggen) installiert. In der Umgebung "R-Demos" verwenden wir Jupyter Notebooks und RStudio (als R-Entwicklungumgebung für größere Programmbibliotheken und zum Debuggen).

Environments-Ansicht

Die Environments-Ansicht dient der Umgebungsverwaltung. Hier können Umgebungen erstellt und gelöscht werden, sowie Pakete für die jeweils ausgewählte Umgebung installiert und aktualisiert werden. Die Paketverwaltung (d.h. das Installieren und Aktualisieren benötigter Programmpakete wie keras oder tensorflow) kann sowohl über die Benutzeroberfläche als auch terminalbasiert mit den entsprechenden conda- oder pip- Befehlen ausgeführt werden.

Im Bild unten ist die Environments-Ansicht des Anaconda Navigator zu sehen, die drei Environments enthält:
base: Das base-Environment ist defaultmäßig nach Installation schon verfügbar und enthält eine Zusammenstellung aktueller Python-Pakete.
PythonKeras: Das PythonKeras-Environment wurde mit dem Befehl conda create --name PythonKeras erstellt. Wir werden es für die Entwicklung Neuronaler Netzwerke verwenden.
R-Demos: Die Umgebung R-Demos wird für die Entwicklung von R-Demonstratoren verwendet und enthält benötigte R-Pakete.

5 Das Paketverwaltungsprogramm Pip

Pip ist das Standdard-Paketverwaltungs-Programm für Python, mit dessen Hilfe man in einem Terminal (cmd.exe) Python-Pakete installieren und aktualisieren kann. Pip-Befehle sind alle nach demselben Schema aufgebaut, nämlich: pip <befehl> [optionen], z.B. pip install pandas oder pip uninstall pandas.

Pip Verwendung

Die wichtigsten pip-Befehle sind:

Weitere Informationen zur Installation von Python-Paketen und Verwendung des Paketmanagement-Tools pip finden Sie hier:
  Python-Tutorial Teil 2: Pakete installieren.


6 Das Paketverwaltungsprogramm Conda

Conda ist das mit Anaconda mitgelieferte Paketverwaltungs-Programm, mit dessen Hilfe man in einem Terminal (cmd.exe) (1) Pakete installieren und aktualisieren kann, sowie (2) Umgebungen (engl. Environments) erstellen, aktivieren / deaktivieren kann. Die Funktionalität von conda ist ähnlich mit der des Paketverwaltungsprogramms pip, mit dem Unterschied, dass conda über die reine Paketverwaltung hinaus auch Umgebungen verwalten kann und für mehr Sprachen als nur Python eingesetzt werden kann. Die wichtigsten conda-Befehle sind conda install, conda update, conda remove, sowie conda create, conda activate und conda deactivate.

Um zum Beispiel eine Anwendungsumgebung mit dem Namen PythonKeras zu erstellen und in diese eine spezielle Zusammenstellung von Programmpaketen zu installieren, werden folgende Befehle verwendet:

  1. Installiere eine Umgebung mit dem Namen PythonKeras.
     conda create --name PythonKeras
  2. Aktiviere die Umgebung PythonKeras.
     conda activate PythonKeras
  3. Zeige alle Pakete an, die in der Umgebung PythonKeras installiert sind
     conda list
  4. Installiere die Programmpakete keras und tensorflow.
    conda install keras
    conda install tensorflow
  5. Deaktiviere PythonKeras - nur erforderlich, wenn man danach in einem anderen Environment arbeiten möchte.
     conda deactivate PythonKeras

Die wichtigsten conda-Befehle sind:

Die Verwendung von Conda-Environments ist dann nützlich, wenn man für bestimmte Anwendungen spezielle Paketkonfigurationen benötigt, z.B. für eine Deep Learning-Anwendung ganz bestimmte Versionen von Python / Keras / Tensorflow, und für andere Anwendungen dann wieder die allerneuesten Versionen der Pakete.

Nächste Schritte

In Python Tutorial Teil 2: Pakete installieren wird beschrieben, wie man mit Hilfe der Paketverwaltungssysteme pip und conda Python-Pakete installiert, aktualisiert und deinstalliert, wie man für verschiedene Projekte passende Anwendungsumgebungen ("environments") erstellt und wie man die installierten Pakete in Python-Skripten mit Hilfe der import-Anweisung korrekt importiert. Die Entwicklung selbstdefinierter Pakete, mit deren Hilfe man größere Projekte strukturieren kann, wird an einem Beispiel vorgestellt.

Teil 3: Python Bibliotheken dieses Python-Tutorials gibt eine Übersicht über die wichtigsten Bibliotheken für Datenanalyse und Maschinelles Lernen. Zunächst werden die Pakete NumPy, Matplotlib und Pandas vorgestellt, die für Datenvorbereitung und -Visualisierung verwendet werden. Anschließend wird die Verwendung der Machine Learning-Bibliothek Scikit-Learn am Beispiel einer Klassifikation für die Vorhersage von Ausfällen erklärt. Schließlich wird die Erstellung eines Künstlichen Neuronalen Netzwerkes für die Bilderkennung mit Hilfe der Bibliotheken Keras und Tensorflow illustriert.


Autoren, Tools und Quellen

Autoren:
 Prof. Dr. Eva Maria Kiss

Tools:

elab2go-Links:

Quellen und weiterführende Links: