Maschinelles Lernen ist heute eine der wirksamsten Methoden, um aus der wachsenden Datenflut in Unternehmen Erkenntnisse und Mehrwert zu gewinnen.
Erfahren Sie von einem Artefact Sie mit Python dank zahlreicher spezialisierter Bibliotheken und einer aktiven Community Machine-Learning-Lösungen implementieren können, die genau auf Ihre Anforderungen zugeschnitten sind.
Ein dreitägiger Kurs (3 x 7 Stunden) mit einem klaren und schrittweisen Lernablauf. Wir achten darauf, dass Sie nicht den Überblick verlieren, und erleichtern Ihnen das Einprägen der Kenntnisse, die Sie für Ihren weiteren Fortschritt benötigen.
Ziele
- Entdecken Sie die wichtigsten Modelle im Bereich des maschinellen Lernens
- Klassifizierung, Regression und Clustering verstehen
- Eine Machine-Learning-Lösung implementieren, messen und optimieren können
Am Ende wirst du in der Lage sein,
Nach Abschluss dieser Schulung, die Theorie, interaktive Übungen mit Python und angeleitete Fallstudien miteinander verbindet, sind Sie in der Lage:
- Die verschiedenen Arten von Algorithmen im maschinellen Lernen kennenlernen
- Den Prozess zur Umsetzung eines Machine-Learning-Projekts verstehen
- Ein komplexes Machine-Learning-Modell mit Tools implementieren
- Messung und Optimierung wichtiger Algorithmen des maschinellen Lernens
- Text Mining betreiben
- Web-Scraping betreiben
Schulungsunterlagen
- Ein Merkblatt, das die wichtigsten Punkte der Schulung zusammenfasst
- Alle während der Sitzung vorgestellten Codes
Bewertung
Die Bewertung der Lernergebnisse erfolgt während der gesamten Schulung im Rahmen von Workshops und praktischen Übungen. Am Ende der Schulung wird systematisch eine sofortige Umfrage zur Zufriedenheit der Teilnehmer durchgeführt, und die Teilnehmer erhalten eine Schulungsbescheinigung, in der die Schulungsziele, die Art, das Programm und die Dauer der Schulungsmaßnahme sowie die Formalisierung der Lernergebnisse aufgeführt sind.
Voraussetzungen
Grundlagen von Python
Öffentlich
Die Bewertung der Lernergebnisse erfolgt während der gesamten Schulung im Rahmen von Workshops und praktischen Übungen. Am Ende der Schulung wird systematisch eine sofortige Umfrage zur Zufriedenheit der Teilnehmer durchgeführt, und die Teilnehmer erhalten eine Schulungsbescheinigung, in der die Schulungsziele, die Art, das Programm und die Dauer der Schulungsmaßnahme sowie die Formalisierung der Lernergebnisse aufgeführt sind.
Benötigtes Material
Ordinateur portable récent (<5 ans) avec droits d’administration
Kursprogramm
Maschinelles Lernen – Erste Schritte
3 Stunden
1.1 Einführung in das maschinelle Lernen
Was ist maschinelles Lernen?
1. Anwendungsfälle aus dem Alltag, Einsatz von ML durch die heutigen Industriegiganten
2. Was ist maschinelles Lernen? Definitionen und Zusammenfassung der wichtigsten Schritte
3. Mögliche Anwendungsfälle in den wichtigsten Branchen, ihre Besonderheiten und Gemeinsamkeiten
4. Kompromiss zwischen Leistung und Interpretierbarkeit: Muss man sich immer zwischen beiden entscheiden?
1.2 Überwachtes Lernen – Data
Fokus auf die häufigste Algorithmusart: das überwachte Lernen
1. Definition der Zielvariable und der erklärenden Variablen. Erstellung des Datensatzes und Aufbereitung der Stichproben.
2. Auswahl und Training des Modells: Bedeutung deskriptiver Statistiken und Vorhersage von Variablen.
3. Wie lässt sich die Leistung eines Modells quantifizieren und darstellen, wobei die für unsere Anforderungen geeignete Metrik gewählt wird
Praktische Übungen
Beaufsichtigte Lehrlingsausbildung
4 Stunden
2.1 Überwachtes Lernen – Umgang mit Überlernen
Überlernen verstehen und vermeiden
- Die in den Daten erkannten Muster verstehen, aber nicht auswendig lernen: Probleme des Unter- und Überlernens
- Datenauswahl: Die richtige Wahl des Trainings- und Testsatzes
- Die Merkmale der Daten in den Stichproben erhalten: die geschichtete Stichprobenziehung
- Umgang mit Werten, die während der Trainingsphase noch nie beobachtet wurden
- Die verfügbaren Daten durch Kreuzvalidierung besser nutzen
- Sonderfall: Zeitreihen
2.2 Überwachtes Lernen – Klassische Algorithmen
Die wichtigsten Algorithmen des überwachten Lernens
- Entscheidungsbäume und die darauf basierenden Ensemble-Modelle: Random Forests und Gradient Boosting
- Support-Vektor-Maschinen
- Optimierung der Hyperparameter: Rastersuche und randomisierte Suche
Nicht beaufsichtigte Ausbildung
3 Stunden
3.1 Unüberwachtes Lernen
Was tun, wenn keine Zielvariable vorhanden ist?
- Methodik und Beispiel für unüberwachtes Lernen: Clusterbildung mit K-Means und DBSCAN
- Kombinieren Sie überwachte und unüberwachte Ansätze, um besser verwertbare Ergebnisse zu erzielen.
- Ein klassisches unüberwachtes Problem: die Dimensionsreduktion. Hauptkomponentenanalyse und Merkmalsauswahl
Textanalyse, Web-Scraping
4 Stunden
4.1 Text Mining
Auswertung von Textdaten
- Erläuterung der Terminologie und möglicher Anwendungsfälle: NLP, NLU, NLG, NER
- Mögliche Datenquellen für ein Projekt
- Die Schritte der Textvorverarbeitung: Bereinigung, Behandlung von Sonderzeichen, Lemmatisierung und Stammbildung
- Wichtigste Algorithmen: TF-IDF, Latent Dirichlet Analysis, Word2Vec, Doc2Vec, …
4.2 Web-Scraping
Daten aus dem Internet extrahieren: verschiedene Ansätze und praktische Umsetzung
- Web-Datenerfassung: Einsatz von APIs vs. Web-Scraping. Kosten und Grenzen beider Ansätze.
- Verwendete Pakete: urllib und beautifulsoup. Zugehörige Übung
- Gesetzliche Auflagen: Man darf nicht alles tun, wozu man fähig ist!
Fallstudie – Datenanalyse
4 Stunden
5.1 Nutzung des Datensatzes
Vorbereitung auf ein Data -Projekt
- Vorstellung der Kaggle-Plattform und Extraktion eines Datensatzes
- Datenexploration: Spaltentypen / fehlende oder Ausreißerwerte, Werteverteilung.
- Datenvisualisierung: Ein- und zweidimensionale Diagramme, Korrelation zwischen Merkmalen
- Variablenaufbereitung: fehlende Werte, Ausreißer, Umgang mit kategorialen Variablen und Feature Engineering
Fallstudie – Modellierung und Vorhersage
3 Stunden
6.1 Erstellung einer Vorlage
Kalibrierung eines Modells
- Erstellung eines Trainings- und Validierungsdatensatzes, Festlegung der Bewertungsmetrik.
- Auswahl der zu testenden Modelle und deren Training. Leistungsmessungen am Zugset.
- Modellkalibrierung: Kreuzvalidierung, Hyperparameteroptimierung (Grid-Suche).
6.2 Vorhersage
Die Leistung des Modells messen
- Vorhersage auf dem Testdatensatz. Fehlerbehebung bei Problemen (z. B. unbekannte kategoriale Variable)
- Bewertung der Vorhersageleistung am Testdatensatz und Vergleich mit den Metriken am Trainingsdatensatz.
- Auswertung der Ergebnisse, Ermittlung des leistungsstärksten Modells, Erörterung möglicher Verbesserungsansätze.







