Während des fünfwöchigen virtuellen Hackathons beeindruckte das Team von Artefact die Jury mit der Entwicklung einer NER-Pipeline (Named Entity Recognition) zur Erkennung von Marken aus der Schönheits- und Kosmetikbranche in Twitter-Posts mit einer integrierten Feedbackschleife.

Ein Team von data-Wissenschaftlern, ML-Ingenieuren und data-Ingenieuren aus dem Pariser Büro von Artefact wurde mit dem zweiten Platz beim Hackathon ausgezeichnet, der von Flyte und MLOps.community, was eine herausragende Leistung innerhalb der MLOps Das Fachgebiet der Gemeinschaft:

  • MLOps.community ist eine offene Gemeinschaft, die darauf abzielt, das wachsende Bedürfnis zu befriedigen, die besten Praktiken von Ingenieuren aus dem Bereich Machine Learning Operations zu teilen.
  • Flyte ist eine Open-Source-Plattform für strukturierte Programmierung und verteilte Verarbeitung, die in Golang implementiert ist und auf Containern basiert.

Der virtuelle fünfwöchige Hackathon bestand darin, eine End-to-End-ML-Anwendung auf Flyte als MLOps-Plattform zu entwickeln. Mit dem Ziel, einen realen Mehrwert in der Produktion zu schaffen, konnte die Idee für das Projekt auf einer beliebigen ML- (maschinelles Lernen) oder Data-Anwendung basieren, z. B. Anwendungsfälle im Einzelhandel, Betrugsschutz oder Computer Vision. Alle Projekte wurden nach ihrer Kreativität, der Qualität der Anwendung und der Verständlichkeit der Modell-UI (Benutzeroberfläche) bewertet.

Das erfahrene Team von Artefact, bestehend aus Senior Data Scientist / ML Engineer Amale El Harmri, Data Engineer Louis Rousselot de Saint Ceran, Senior Data Scientist Karim Si Larbi, Senior Data Scientist Hugo Vasselin und Data Scientist Sascha Lasry, arbeitete an diesem Hackathon zusätzlich zu seiner Kunden- und internen Arbeitsbelastung. Während des Wettbewerbs trug das Team den Namen “adorable-unicorns23”.”

“Die freiwillige Teilnahme an diesem Hackathon zeigt, wie sehr sich unser Team für die Werte unseres Unternehmens - Zusammenarbeit und Innovation - einsetzt. Ob im Büro oder außerhalb des Büros, wir teilen die Leidenschaft, im Team neue Dinge zu schaffen.”
sagte Amale El Harmri, Senior Data Scientist / ML Engineer bei Artefact.

Da sich die Schönheits- und Kosmetikindustrie in ständiger Entwicklung befindet, konzentrierte sich das Team auf eine mögliche Strategie, Indie- oder unabhängige Marken zu finden, die innovativ und in der Öffentlichkeit beliebt sind, und diese aufzukaufen. Daher hat das Team ein Modul zur Markenidentifizierung auf Twitter data flows entwickelt, das eine Schnittstelle zur Kennzeichnung der gestohlenen Produkte enthält.

Um das Projekt abzuschließen, hat das Team den Prozess in drei Abschnitte unterteilt:

  • NER-Anwendungsworkflow: bestehend aus dem Scrapen von Tweets mit Schönheitsbezug aus Twitter und dem anschließenden Extrahieren von NER-Entitäten aus dem Inhalt der Posts
  • Manueller Teil der Etikettierung in Label Studio: Sie nehmen sich die Zeit, dieselben Stellen zu beschriften, um zu prüfen, ob sie fehlen oder falsch sind. 
  • NER-Trainingsablauf: Bewertung des NER-Modells auf der Grundlage der Etikettierung, um entweder den Arbeitsablauf abzuschließen, wenn er erfolgreich ist, oder ein neues Modell mit frisch etikettiertem data zu trainieren, wenn er nicht erfolgreich ist

“Es war das erste Mal, dass ein Mitglied unseres Teams Flyte verwendet hat. Dank des intuitiven SDK (Software Development Kit) und der Dokumentation der Plattform konnte das Team Aufgaben und Workflows sehr schnell einreichen. Dieser Hackathon war eine unglaubliche Erfahrung für das Team, um seine fortgeschrittenen MLOps-Kenntnisse unter Beweis zu stellen!”
sagte Robin Doumerc, Staff ML Engineer bei Artefact.

Um die vollständige Online-Präsentation des Projekts von Artefact vor der Jury der MLOps.community im Rahmen von MLOps #98 zu sehen, folgen Sie dem Link Hier und springen Sie zum Zeitstempel 41:22.