Maschinelles Lernen mit Python

Maschinelles Lernen ist heute eine der wirksamsten Methoden, um aus der wachsenden Datenflut in Unternehmen Erkenntnisse und Mehrwert zu gewinnen.

Erfahren Sie von einem Artefact Sie mit Python dank zahlreicher spezialisierter Bibliotheken und einer aktiven Community Machine-Learning-Lösungen implementieren können, die genau auf Ihre Anforderungen zugeschnitten sind.

Ein dreitägiger Kurs (3 x 7 Stunden) mit einem klaren und schrittweisen Lernablauf. Wir achten darauf, dass Sie nicht den Überblick verlieren, und erleichtern Ihnen das Einprägen der Kenntnisse, die Sie für Ihren weiteren Fortschritt benötigen.

Ziele

Entdecken Sie die wichtigsten Modelle im Bereich des maschinellen Lernens
Klassifizierung, Regression und Clustering verstehen
Eine Machine-Learning-Lösung implementieren, messen und optimieren können

Am Ende wirst du in der Lage sein,

Nach Abschluss dieser Schulung, die Theorie, interaktive Übungen mit Python und angeleitete Fallstudien miteinander verbindet, sind Sie in der Lage:

Die verschiedenen Arten von Algorithmen im maschinellen Lernen kennenlernen
Den Prozess zur Umsetzung eines Machine-Learning-Projekts verstehen
Ein komplexes Machine-Learning-Modell mit Tools implementieren
Messung und Optimierung wichtiger Algorithmen des maschinellen Lernens
Text Mining betreiben
Web-Scraping betreiben

Schulungsunterlagen

Ein Merkblatt, das die wichtigsten Punkte der Schulung zusammenfasst
Alle während der Sitzung vorgestellten Codes

Bewertung

Die Bewertung der Lernergebnisse erfolgt während der gesamten Schulung im Rahmen von Workshops und praktischen Übungen. Am Ende der Schulung wird systematisch eine sofortige Umfrage zur Zufriedenheit der Teilnehmer durchgeführt, und die Teilnehmer erhalten eine Schulungsbescheinigung, in der die Schulungsziele, die Art, das Programm und die Dauer der Schulungsmaßnahme sowie die Formalisierung der Lernergebnisse aufgeführt sind.

Voraussetzungen

Grundlagen von Python

Öffentlich

Benötigtes Material

Ordinateur portable récent (<5 ans) avec droits d’administration

Diesen Kurs buchen

Leitender Ausbilder

Rafaëlle Aygalenq

Bei Artefact hat Rafaëlle erfolgreich an verschiedenen komplexen Themen gearbeitet, die vom Datenmarketing über die Bildverarbeitung und die Verarbeitung natürlicher Sprache bis hin zur Prognoseerstellung für verschiedene Unternehmen reichten.

Insbesondere verfügt Rafaëlle über Erfahrung bei der Berechnung der Auswirkungen von Werbeaktionen im Rahmen der Umsatzprognose.

Kursprogramm

Modul 1Modul 2Modul 3Modul 4Modul 5Modul 6

Maschinelles Lernen – Erste Schritte

3 Stunden

1.1 Einführung in das maschinelle Lernen
Was ist maschinelles Lernen?
1. Anwendungsfälle aus dem Alltag, Einsatz von ML durch die heutigen Industriegiganten
2. Was ist maschinelles Lernen? Definitionen und Zusammenfassung der wichtigsten Schritte
3. Mögliche Anwendungsfälle in den wichtigsten Branchen, ihre Besonderheiten und Gemeinsamkeiten
4. Kompromiss zwischen Leistung und Interpretierbarkeit: Muss man sich immer zwischen beiden entscheiden?

1.2 Überwachtes Lernen – Data
Fokus auf die häufigste Algorithmusart: das überwachte Lernen
1. Definition der Zielvariable und der erklärenden Variablen. Erstellung des Datensatzes und Aufbereitung der Stichproben.
2. Auswahl und Training des Modells: Bedeutung deskriptiver Statistiken und Vorhersage von Variablen.
3. Wie lässt sich die Leistung eines Modells quantifizieren und darstellen, wobei die für unsere Anforderungen geeignete Metrik gewählt wird
Praktische Übungen

Beaufsichtigte Lehrlingsausbildung

4 Stunden

2.1 Überwachtes Lernen – Umgang mit Überlernen

Überlernen verstehen und vermeiden

Die in den Daten erkannten Muster verstehen, aber nicht auswendig lernen: Probleme des Unter- und Überlernens
Datenauswahl: Die richtige Wahl des Trainings- und Testsatzes
Die Merkmale der Daten in den Stichproben erhalten: die geschichtete Stichprobenziehung
Umgang mit Werten, die während der Trainingsphase noch nie beobachtet wurden
Die verfügbaren Daten durch Kreuzvalidierung besser nutzen
Sonderfall: Zeitreihen

2.2 Überwachtes Lernen – Klassische Algorithmen

Die wichtigsten Algorithmen des überwachten Lernens

Entscheidungsbäume und die darauf basierenden Ensemble-Modelle: Random Forests und Gradient Boosting
Support-Vektor-Maschinen
Optimierung der Hyperparameter: Rastersuche und randomisierte Suche

Nicht beaufsichtigte Ausbildung

3 Stunden

3.1 Unüberwachtes Lernen

Was tun, wenn keine Zielvariable vorhanden ist?

Methodik und Beispiel für unüberwachtes Lernen: Clusterbildung mit K-Means und DBSCAN
Kombinieren Sie überwachte und unüberwachte Ansätze, um besser verwertbare Ergebnisse zu erzielen.
Ein klassisches unüberwachtes Problem: die Dimensionsreduktion. Hauptkomponentenanalyse und Merkmalsauswahl

Textanalyse, Web-Scraping

4 Stunden

4.1 Text Mining

Auswertung von Textdaten

Erläuterung der Terminologie und möglicher Anwendungsfälle: NLP, NLU, NLG, NER
Mögliche Datenquellen für ein Projekt
Die Schritte der Textvorverarbeitung: Bereinigung, Behandlung von Sonderzeichen, Lemmatisierung und Stammbildung
Wichtigste Algorithmen: TF-IDF, Latent Dirichlet Analysis, Word2Vec, Doc2Vec, …

4.2 Web-Scraping

Daten aus dem Internet extrahieren: verschiedene Ansätze und praktische Umsetzung

Web-Datenerfassung: Einsatz von APIs vs. Web-Scraping. Kosten und Grenzen beider Ansätze.
Verwendete Pakete: urllib und beautifulsoup. Zugehörige Übung
Gesetzliche Auflagen: Man darf nicht alles tun, wozu man fähig ist!

Fallstudie – Datenanalyse

4 Stunden

5.1 Nutzung des Datensatzes

Vorbereitung auf ein Data -Projekt

Vorstellung der Kaggle-Plattform und Extraktion eines Datensatzes
Datenexploration: Spaltentypen / fehlende oder Ausreißerwerte, Werteverteilung.
Datenvisualisierung: Ein- und zweidimensionale Diagramme, Korrelation zwischen Merkmalen
Variablenaufbereitung: fehlende Werte, Ausreißer, Umgang mit kategorialen Variablen und Feature Engineering

Fallstudie – Modellierung und Vorhersage

3 Stunden

6.1 Erstellung einer Vorlage

Kalibrierung eines Modells

Erstellung eines Trainings- und Validierungsdatensatzes, Festlegung der Bewertungsmetrik.
Auswahl der zu testenden Modelle und deren Training. Leistungsmessungen am Zugset.
Modellkalibrierung: Kreuzvalidierung, Hyperparameteroptimierung (Grid-Suche).

6.2 Vorhersage

Die Leistung des Modells messen

Vorhersage auf dem Testdatensatz. Fehlerbehebung bei Problemen (z. B. unbekannte kategoriale Variable)
Bewertung der Vorhersageleistung am Testdatensatz und Vergleich mit den Metriken am Trainingsdatensatz.
Auswertung der Ergebnisse, Ermittlung des leistungsstärksten Modells, Erörterung möglicher Verbesserungsansätze.

MASCHINELLES LERNEN