Best
 
Full Digital
 
Fantom Tag

Schulung - Machine Learning mit Python & Scikit Learn

  • Live Online Training
DURCHFÜHRUNG MIT TERMIN
Dauer
14 Stunden

Preis ab
1.290,00 € netto
1.535,10 € inkl. 19% MwSt.

Nr.
54500
TERMIN UND ORT NACH ABSPRACHE
On-demand Training
Sind Sie an diesem Thema interessiert?
Unsere Experten entwickeln Ihr individuell angepasstes Seminar!

Der Kurs "Grundlagen des Maschinellen Lernens mit scikit-learn und Python" behandelt in einem zweitägigen Seminar die Konzepte des überwachten und unüberwachten Lernens mit Hilfe des Python Moduls scikit-learn.
Es wird vorausgesetzt, dass die Teilnehmer grundlegende Kenntnisse in Python besitzen.

Der Kurs vermittelt Ihnen die Grundlagen des Machine Learning und zeigt Ihnen, wie Sie Machine Learning mit Python und der Bibliothek scikit-learn umsetzen können. Machine Learning ist eine wichtige Algorithmenklasse der Künstlichen Intelligenz und umfasst sowohl supervised learning als auch unsupervised learning.

Wir werden uns auf supervised learning konzentrieren, bei dem Algorithmen mit gelabelten Daten trainiert werden, um bestimmte Aufgaben zu erlernen. Beispiele für supervised learning sind die Klassifikation von Fehlern in Bauteilen oder die Vorhersage des Umsatzes eines Kunden.

Unsupervised learning hingegen benötigt keine gelabelten Daten, sondern versucht, Muster oder Gruppen in den vorhandenen Daten zu erkennen. Dies kann zum Beispiel für die Kundengruppierung verwendet werden.

Der Kurs verwendet die Programmiersprache Python, die sowohl im Machine Learning als auch im Deep Learning weit verbreitet ist. Die Bibliothek scikit-learn bietet zahlreiche Algorithmen, die das Lernen von Machine Learning erleichtern.

Wir werden hauptsächlich das Python-Modul scikit-learn verwenden, um die Algorithmen im Machine Learning zu lernen und zu programmieren. Das Modul StatsModels wird auch für die logistische Regression verwendet, um einen Einblick in eine weitere bekannte Bibliothek für Machine Learning zu erhalten.

Der Fokus des Kurses liegt auf supervised learning. Wir werden verschiedene Algorithmen theoretisch erläutern und praktisch in Python programmieren, darunter Lineare Regression, logistische Regression, Entscheidungsbaum, Ensemble-Methoden (Random-Forest und AdaBoost), K-Nearest Neighbor und Neuronale Netze (Multi-Layer Perceptron, MLP).

Wir werden auch das Konzept des Daten-Splittings in Trainings- und Testdaten sowie die Kreuzvalidierung erläutern, um Overfitting zu erkennen. Darüber hinaus werden wir die Hyperparametersuche und die wichtigsten Metriken zur Bestimmung der Algorithmusgüte kennenlernen.

Im unsupervised learning werden wir uns mit dem Clustering-Algorithmus K-means und DBSCAN befassen.

Nach diesem Kurs werden Sie die Grundlagen von scikit-learn und Machine Learning gelernt haben und in der Lage sein, erste Aufgaben eigenständig zu bearbeiten. Sie werden auch die Fähigkeit haben, Ihre Programmierkenntnisse in Python zu erweitern, um weitere Algorithmen aus scikit-learn umzusetzen.

Lesen Sie mehr
Zielgruppe

Wer sollte teilnehmen:

Zielgruppe

Dieser Python-basierte Machine Learning Kurs richtet sich an Fachleute wie Data Scientists, angehende Machine Learning Engineers, Datenanalysten, Business Intelligence Analysten und Data Analysten, die ihre Programmierkenntnisse in Python für Data Science und Data Mining vertiefen möchten. Die Schulung erweitert vorhandene Python-Programmierkenntnisse, um eigenständig Machine Learning mit scikit-learn umsetzen zu können

Voraussetzungen

Diese Schulung zum Thema Machine Learning erfordert Programmiererfahrung in Python. Es ist wichtig, bereits Erfahrung in der Arbeit mit Python und Daten zu haben. Der Kurs "Data Science mit Python" gibt einen Überblick über die erforderlichen Vorkenntnisse, um gut an dem Seminar teilnehmen zu können. Insbesondere sollten Sie Kenntnisse über pandas Data.Frames (Ergänzen fehlender Werte, Einlesen von Daten), Installation und Laden von Bibliotheken, Schreiben eigener Funktionen sowie Kenntnisse über verschiedene Datenstrukturen (Liste, Wörterbuch, Tupel) haben.

Darüber hinaus sind grundlegende Kenntnisse in Statistik (Definitionen wie Durchschnitt, Median, Standardabweichung, Normalverteilung), grundlegende mathematische Symbole und Begriffe (Summenzeichen, Integral, Funktion, Ableitung, Exponentialfunktion) und Kenntnisse der booleschen Algebra mit den logischen Operatoren (UND, ODER, NICHT) erforderlich.

Die Schulung zum Thema Machine Learning wird auf Deutsch durchgeführt. Englischkenntnisse (insbesondere im Verständnis englischer Texte) sind sehr empfehlenswert, da die Programmiersprache, Fachbegriffe und die Dokumentationen im Internet auf Englisch sind. Aus diesem Grund sind auch die erstellten Folien in der Schulung auf Englisch.
Trainingsprogramm

Trainingsprogramm

Grundlegende Einblicke in das Feld des Maschinellen Lernens:

  • Einführung in das Gebiet des Maschinellen Lernens
  • Erläuterung der Unterschiede zwischen überwachtem und unüberwachtem Lernen
  • Überwindung von Overfitting durch kluge Datasplitting-Strategien (Training vs. Testdaten)

Basiswissen zur Linearen Regression:

  • Verständnis für den Linearen Regressionsalgorithmus aufbauen
  • Richtige Aufteilung von Daten in Training und Test
  • Praktische Umsetzung der Linearen Regression in Python (mit scikit-learn)
  • Solide Überprüfung der Ergebnisse

Eintauchen in die Logistische Regression (unter Nutzung von StatsModels):

  • Aufbau des Verständnisses für die Logistische Regression (Entwicklung von linear zu logistisch)
  • Sorgfältige Datenaufteilung für Training und Test
  • Implementierung der Logistischen Regression in Python
  • Kritische Prüfung und Bewertung der Ergebnisse und des Modells (AIC, BIC, Konfusionsmatrix)
  • Erläuterung der Koeffizienteninterpretation (Odds-Ratio)
  • Roc Curve und Fläche unter der Kurve (AUC) im Fokus

Tiefere Einblicke in den Entscheidungsbaum-Algorithmus:

  • Verständnis für den Entscheidungsbaum-Algorithmus entwickeln
  • Richtige Aufteilung von Daten in Training und Test
  • Konkrete Umsetzung des Entscheidungsbaums in Python (mit scikit-learn)
  • Feintuning der Hyperparameter für optimale Leistung
  • Sorgfältige Validierung der Ergebnisse (Konfusionsmatrix, Genauigkeit)
  • Anwendung des Entscheidungsbaums für Regressionsszenarien

Ensemble-Methoden und ihre Effektivität:

  • Ein Ensemble aus verschiedenen Algorithmen mit scikit-learn realisieren
  • Random Forest für Klassifikation und Regression nutzen
  • Einsatz von Ada Boost für Klassifikation und Regression verstehen
  • Feintuning der Hyperparameter für optimierte Ergebnisse
  • Akkurate Bewertung der Modellleistung durch gezielte Validierung

Erkundung weiterer Schlüsselalgorithmen:

  • K-Nearest Neighbor-Verfahren beleuchten
  • Einfaches Neuronales Netz (Multi-Layer Perceptron, MLP) betrachten
  • Direkte Umsetzung der Algorithmen in Python
  • Gründliche Ergebnisüberprüfung und -bewertung

Optimierung von Hyperparametern und Anwendung von Kreuzvalidierung:

  • Automatisierte Suche nach optimalen Hyperparametern
  • Kreuzvalidierung (Cross-Validation) als Schlüssel zur Modellbewertung
  • Umsetzung dieser Konzepte in scikit-learn

Erkundung von Clustering-Algorithmen:

  • Basisverständnis für K-Means Clustering und DBScan erlangen
  • Interpretation der Ergebnisse von Clustering-Vorgängen
  • Vergleich der Ergebnisse verschiedener Clustering-Methoden
Schulungsmethode

Schulungsmethode

Das Seminar legt großen Wert auf Praxisorientierung. Die Teilnehmer haben die Möglichkeit, direkt und eigenständig mit der Programmiersprache Python in der Entwicklungsumgebung Spyder zu arbeiten. Dadurch können sie das Gelernte sofort in Übungen anwenden und vertiefen. Der Trainer unterstützt die Teilnehmer dabei, indem er verschiedene Aufgaben moderiert und sie durch die einzelnen Lehreinheiten begleitet.

Hinweis

Hinweis

Die Teilnehmer benötigen für die Übungsaufgaben Laptops. Wir empfehlen, Ihren eigenen Laptop mit der vorab installierten Software mitzubringen. Eine genaue Installationsanleitung für die Software wird Ihnen vor dem Seminar per E-Mail zugesandt. Auf Anfrage stellen wir auch Schulungslaptops zur Verfügung.

Bitte prüfen Sie, ob Ihr Firmenlaptop Zugangsbeschränkungen im Internet hat. Die digitalen Unterlagen (Skript, Code, Dateien) werden im Seminar online zum Download zur Verfügung gestellt. Sie erhalten vor dem Seminar per E-Mail den Link zu einer Testdatei zum Download, um dies überprüfen zu können.

Sie sollten sich in firmenfremde WLAN-Netze registrieren können.

Als Backup Lösung ist es möglich, dass der USB Port bei Ihrem Laptop freigeschaltet ist, um damit verwendete Dateien oder sonstige Unterlagen übertragen zu können.

Im Seminar wird das Betriebssystem Windows verwendet. Der Umgang mit Ihrem verwendeten Betriebssystem und Laptop sollte bekannt sein. Insbesondere sollten Sie ohne Schwierigkeiten Sonderzeichen auf der Tastatur finden (insbesondere bei Apple Geräten werden auf manchen Tastaturen nicht immer runde, eckige bzw. geschweifte Klammern dargestellt).

Hinweis für Online-Schulungen:

Für unsere Online-Schulungen möchten wir Sie darauf hinweisen, dass es von Vorteil ist, wenn Sie über zwei Bildschirme verfügen. Ein zusätzlicher Bildschirm ermöglicht es Ihnen, die Schulungsinhalte auf einem Bildschirm anzuzeigen, während Sie auf dem anderen Bildschirm praktische Übungen durchführen oder Anwendungen parallel öffnen können.

Durch die Verwendung von zwei Bildschirmen können Sie die Schulungsinhalte effektiver verfolgen und gleichzeitig interaktiv an den Übungen teilnehmen, ohne zwischen Fenstern hin- und herwechseln zu müssen.

Wir empfehlen daher, sich im Vorfeld auf die Schulung mit einem zusätzlichen Bildschirm vorzubereiten, um das bestmögliche Lernerlebnis zu gewährleisten

Weitere Seminare aus dem Bereich Data Science, Machine Learning & KI

Termine

  • 1.290,00 € Netto
    Noch freie Plätze
    Jetzt buchen
    Cegos Integrata GmbH Frankfurt
    Hahnstr. 70
    60528 Frankfurt
  • 1.290,00 € Netto
    Noch freie Plätze
    Jetzt buchen
    online Training
    Live Online Training
  • 1.290,00 € Netto
    Noch freie Plätze
    Jetzt buchen
    Cegos Integrata GmbH Düsseldorf
    Grafenberger Allee 293
    40237 Düsseldorf
  • 1.290,00 € Netto
    Noch freie Plätze
    Jetzt buchen
    online Training
    Live Online Training
  • 1.290,00 € Netto
    Noch freie Plätze
    Jetzt buchen
    online Training
    Live Online Training
Schulung - Machine Learning mit Python & Scikit Learn