Während des fünfwöchigen virtuellen Hackathons beeindruckte das Team von Artefactdie Jury mit der Entwicklung einer NER-Pipeline (Named Entity Recognition) zur Erkennung von Marken aus der Schönheits- und Kosmetikbranche in Twitter-Posts mit einer integrierten Feedbackschleife.

Ein Team von Datenwissenschaftlern, ML-Ingenieuren und Dateningenieuren aus dem Pariser Büro von Artefactwurde mit dem zweiten Platz beim Hackathon von Flyte und MLOps.community ausgezeichnet, was eine herausragende Leistung im Bereich der MLOps Community Expertise darstellt:

  • MLOps.community ist eine offene Gemeinschaft, die das wachsende Bedürfnis befriedigen soll, bewährte Praktiken aus der Praxis des maschinellen Lernens mit Ingenieuren zu teilen
  • Flyte ist eine quelloffene, container-native Plattform für strukturierte Programmierung und verteilte Verarbeitung, die in Golang implementiert ist.

Der virtuelle fünfwöchige Hackathon bestand darin, eine End-to-End-ML-Anwendung auf Flyte als MLOps-Plattform zu entwickeln. Mit dem Ziel, einen realen Mehrwert in der Produktion zu schaffen, konnte die Idee für das Projekt auf einer beliebigen ML- (maschinelles Lernen) oder Datenanwendung basieren, z. B. Anwendungsfälle im Einzelhandel, Betrugsschutz oder Computer Vision. Alle Projekte wurden auf der Grundlage von Kreativität, der Leistung des Teams bei der Anwendung und der Verständlichkeit der Modell-UI (Benutzeroberfläche) bewertet.

ArtefactDas erfahrene Team, bestehend aus dem Senior Data Scientist / ML Engineer Amale El Harmri, dem Data Engineer Louis Rousselot de Saint Ceran, dem Senior Data Scientist Karim Si Larbi, dem Senior Data Scientist Hugo Vasselin und dem Data Scientist Sascha Lasry, arbeitete an diesem Hackathon zusätzlich zu seiner Kunden- und internen Arbeitsbelastung. Während des Wettbewerbs trug das Team den Namen "adorable-unicorns23".

"Die freiwillige Teilnahme an diesem Hackathon zeigt das Engagement unseres Teams für die Werte unseres Unternehmens, nämlich Zusammenarbeit und Innovation. Ob im Büro oder außerhalb des Büros, wir teilen die Leidenschaft, als Team neue Dinge zu schaffen.
sagt Amale El Harmri, Senior Data Scientist / ML Engineer bei Artefact.

Da sich die Schönheits- und Kosmetikindustrie in ständiger Entwicklung befindet, konzentrierte sich das Team auf eine mögliche Strategie, um unabhängige Marken zu finden, die innovativ und in der Öffentlichkeit beliebt sind, und diese aufzukaufen. Daher baute das Team ein Modul zur Markenidentifizierung auf der Grundlage von Twitter-Datenströmen, das eine Schnittstelle zur Kennzeichnung der gestohlenen Marken enthielt.

Um das Projekt abzuschließen, unterteilte das Team den Prozess in drei Abschnitte:

  • NER-Anwendungsworkflow: bestehend aus dem Scraping von Tweets aus Twitter, die sich auf Schönheit beziehen, und der anschließenden Extraktion von NER-Entitäten aus dem Inhalt der Posts
  • Manuelle Beschriftung in Label Studio: sich die Zeit nehmen, dieselben Stellen zu beschriften, um zu prüfen, ob es fehlende oder falsche Einheiten gibt 
  • NER-Trainingsworkflow: Bewertung des NER-Modells auf der Grundlage der Etikettierung, um entweder den Workflow abzuschließen, wenn er erfolgreich ist, oder ein neues Modell mit frisch etikettierten Daten zu trainieren, wenn er nicht erfolgreich ist

"Es war das erste Mal, dass ein Mitglied unseres Teams Flyte verwendet hat. Das Team war in der Lage, Aufgaben und Workflows sehr schnell einzureichen, dank des intuitiven SDK (Software Development Kit) und der Dokumentation der Plattform. Dieser Hackathon war eine unglaubliche Erfahrung für das Team, um seine fortgeschrittenen MLOps-Kenntnisse zu demonstrieren!"
sagte Robin Doumerc, Staff ML Engineer bei Artefact.

Um die vollständige Online-Präsentation des Projekts Artefactvor der Jury von MLOps.community im Rahmen von MLOps #98 zu sehen, folgen Sie dem Link hier und springen Sie zur Zeitmarke 41:22.

Artefact Newsletter

Interessiert an Datenberatung | Daten & Digitales Marketing | Digitaler Handel?
Lesen Sie unseren monatlichen Newsletter und erhalten Sie umsetzbare Ratschläge, Einblicke und Business Cases von unseren Datenexperten aus aller Welt!