Au cours de ce hackathon virtuel de cinq semaines, l'équipe de Artefact a impressionné les juges en développant un pipeline NER (Named Entity Recognition) pour détecter les marques du secteur de la beauté et des cosmétiques dans les messages Twitter, avec une boucle de retour intégrée.

Une équipe de scientifiques de data, d'ingénieurs ML et d'ingénieurs data du bureau parisien de Artefact a remporté la deuxième place lors du Hackathon organisé par Flyte et MLOps.community, Il s'agit d'une réussite exceptionnelle au sein de l'Union européenne. MLOps Domaine de l'expertise communautaire :

  • MLOps.community est une communauté ouverte qui vise à répondre au besoin croissant de partage des meilleures pratiques en matière d'opérations d'apprentissage automatique de la part d'ingénieurs sur le terrain.
  • Flyte est une plateforme de programmation structurée et de traitement distribué, open-source et native aux conteneurs, implémentée en Golang

Le hackathon virtuel de cinq semaines consistait à créer une application ML de bout en bout sur Flyte en tant que plateforme MLOps. L'objectif étant d'ajouter une valeur réelle à la production, l'idée du projet pouvait être basée sur n'importe quelle application ML (machine learning) ou Data, comme les cas d'utilisation dans le commerce de détail, la protection contre la fraude ou la vision par ordinateur. Tous les projets ont été jugés sur la base de la créativité, de la qualité de l'exécution de l'application par l'équipe et de la facilité de compréhension du modèle UI (interface utilisateur).

L'équipe expérimentée de Artefact, composée de Amale El Harmri, scientifique senior de Data et ingénieur ML, Louis Rousselot de Saint Ceran, scientifique senior de Data, Karim Si Larbi, scientifique senior de Data, Hugo Vasselin, et Sascha Lasry, scientifique de Data, a travaillé sur ce Hackathon en plus de sa charge de travail interne et pour le compte de ses clients. Pendant la compétition, l'équipe avait pour nom “adorable-unicorns23”.”

“Le fait de se porter volontaire pour participer à ce Hackathon démontre l'engagement de notre équipe envers les valeurs de collaboration et d'innovation de notre entreprise. Que ce soit au bureau ou en dehors, nous partageons une passion pour la création de nouvelles choses en équipe.”
a déclaré Amale El Harmri, scientifique principal Data / ingénieur ML chez Artefact.

Reconnaissant que l'industrie de la beauté et des cosmétiques est en constante évolution, l'équipe s'est concentrée sur une stratégie possible pour trouver des marques indépendantes qui sont innovantes et populaires auprès du public et les racheter. L'équipe a donc construit un module d'identification des marques sur les flux Twitter data qui comprenait une interface d'étiquetage au vol.

Pour mener à bien le projet, l'équipe a divisé le processus en trois sections :

  • Flux de travail de l'application NERLe système d'information sur la beauté : il s'agit de récupérer des tweets relatifs à la beauté sur Twitter, puis d'extraire des entités NER du contenu des messages.
  • Étiquetage manuel dans Label Studiole fait de prendre le temps d'étiqueter ces mêmes postes pour vérifier qu'aucune entité n'a été oubliée ou n'est incorrecte 
  • Flux de travail pour la formation NER : évaluer le modèle NER sur la base de l'étiquetage afin de terminer le flux de travail en cas de succès ou d'entraîner un nouveau modèle avec le data fraîchement étiqueté en cas d'échec.

“C'était la première fois qu'un membre de notre équipe utilisait Flyte, l'équipe a pu soumettre des tâches et des flux de travail très rapidement, grâce au SDK (Software Development Kit) intuitif et à la documentation de la plateforme. Ce Hackathon a été une expérience incroyable pour l'équipe qui a pu démontrer son expertise avancée en matière de MLOps !”
a déclaré Robin Doumerc, ingénieur en chef de la ML à Artefact.

Pour voir la présentation complète en ligne du projet de Artefact au jury de la communauté MLOps dans le cadre de MLOps #98, suivez le lien. ici et passez à l'heure 41:22.