Tijdens de vijf weken durende virtuele Hackathon maakte het team van Artefact indruk op de jury door een NER-pijplijn (Named Entity Recognition) te ontwikkelen om merken in de beauty- en cosmeticasector te detecteren in Twitter-posts met een geïntegreerde feedbacklus.

Een team van data wetenschappers, ML-ingenieurs en data ingenieurs van Artefact's kantoor in Parijs werd bekroond met de tweede plaats in de Hackathon georganiseerd door Flyte en MLOps.gemeenschap, wat een uitstekende prestatie is binnen de MLOps Deskundigheidsgebied van de Gemeenschap:

  • MLOps.gemeenschap is een open gemeenschap die de groeiende behoefte wil invullen om best practices van Machine Learning Operations uit de praktijk te delen met ingenieurs uit de praktijk.
  • Flyte is een open-source, container-native, gestructureerd programmeer- en gedistribueerd verwerkingsplatform geïmplementeerd in Golang

De virtuele vijf weken durende hackathon bestond uit het creëren van een end-to-end ML-applicatie op Flyte als het MLOps-platform. Met het doel om echte waarde toe te voegen in de productie, kon het idee voor het project gebaseerd zijn op elke ML (machine learning) of Data toepassing, zoals retail-use-cases, fraudebescherming of computer vision. Alle projecten werden beoordeeld op creativiteit, hoe goed het team de toepassing gebruikte en hoe gemakkelijk de UI (gebruikersinterface) van het model te begrijpen was.

Artefact's ervaren team, bestaande uit Senior Data Scientist / ML Engineer Amale El Harmri, Data Engineer Louis Rousselot de Saint Ceran, Senior Data Scientist Karim Si Larbi, Senior Data Scientist Hugo Vasselin, en Data Scientist Sascha Lasry, werkten aan deze Hackathon in aanvulling op hun klant en interne werklast. Tijdens de wedstrijd had het team de naam “adorable-unicorns23”.”

“Vrijwillig deelnemen aan deze Hackathon laat zien dat ons team zich inzet voor de waarden van ons bedrijf op het gebied van samenwerking en innovatie. Of het nu op kantoor is of daarbuiten, we delen een passie om als team nieuwe dingen te creëren.”
zegt Amale El Harmri, Senior Data Scientist / ML Engineer bij Artefact.

In het besef dat de schoonheids- en cosmetica-industrie voortdurend evolueert, concentreerde het team zich op een mogelijke strategie om indie-merken, of merken in onafhankelijk bezit, te vinden die innovatief en populair zijn bij het publiek en om ze uit te kopen. Daarom bouwde het team een merkidentificatiemodule op Twitter data flows die een etiketteringsinterface bij de gestolen bevatte.

Om het project te voltooien, verdeelde het team het proces in drie delen:

  • NER-toepassingsworkflow: bestaande uit het schrapen van schoonheidsgerelateerde tweets van Twitter en vervolgens het extraheren van NER-entiteiten uit de inhoud van berichten
  • Handmatig etiketteren in Label Studio: de tijd nemen om diezelfde berichten te labelen om te controleren op gemiste of onjuiste entiteiten 
  • NER-trainingsworkflow: het NER-model evalueren op basis van labeling om de workflow te voltooien als dat gelukt is, of een nieuw model te trainen met vers gelabelde data als dat niet gelukt is

“Dit was de eerste keer dat een lid van ons team Flyte gebruikte, het team was in staat om taken en workflows zeer snel in te dienen, dankzij de intuïtieve SDK (Software Development Kit) en documentatie van het platform. Deze Hackathon was een ongelooflijke ervaring voor het team om hun geavanceerde MLOps-expertise te demonstreren!”
zegt Robin Doumerc, Staff ML Engineer bij Artefact.

Volg de link om de volledige online presentatie van Artefact over hun project aan de jury van MLOps.community in het kader van MLOps #98 te bekijken hier en ga naar de 41:22 tijdstempel.