Durante el Hackathon virtual de cinco semanas de duración, el equipo de Artefact impresionó a los jueces al desarrollar una tubería NER (Reconocimiento de Entidades Nombradas) para detectar marcas del sector de la belleza y la cosmética en las publicaciones de Twitter con un bucle de retroalimentación integrado.

Un equipo de científicos, ingenieros de ML e ingenieros de data de la oficina parisina de Artefact obtuvo el segundo puesto en el Hackathon organizado por Flyte y MLOps.community, lo que supone un logro excepcional dentro del MLOps Ámbito del peritaje comunitario:

  • MLOps.community es una comunidad abierta que pretende cubrir la creciente necesidad de compartir las mejores prácticas de las operaciones de aprendizaje automático en el mundo real por parte de ingenieros en la materia
  • Flyte es una plataforma de código abierto, nativa de contenedores, de programación estructurada y procesamiento distribuido implementada en Golang

El hackathon virtual de cinco semanas consistió en crear una aplicación ML de extremo a extremo en Flyte como plataforma MLOps. Con el objetivo de añadir valor al mundo real en la producción, la idea del proyecto podía basarse en cualquier aplicación ML (aprendizaje automático) o Data, como casos de uso en el comercio minorista, protección contra el fraude o visión por ordenador. Todos los proyectos se juzgaron en función de la creatividad, de lo bien que el equipo ejecutó el uso de la aplicación y de lo fácil que era entender la UI (interfaz de usuario) del modelo.

El experimentado equipo de Artefact, compuesto por el Científico Senior Data / Ingeniero ML Amale El Harmri, el Data Engineer Louis Rousselot de Saint Ceran, el Científico Senior Data Karim Si Larbi, el Científico Senior Data Hugo Vasselin y el Científico Data Sascha Lasry, trabajó en este Hackathon además de en su carga de trabajo interna y con clientes. Durante la competición, el equipo tenía el nombre de “adorable-unicornios23”.”

“Participar voluntariamente en este Hackathon demuestra el compromiso de nuestro equipo con los valores de colaboración e innovación de nuestra empresa. Ya sea en la oficina o fuera de ella, compartimos la pasión por crear cosas nuevas en equipo.”
afirmó Amale El Harmri, científico senior / ingeniero de ML de Data.

Reconociendo que la industria de la belleza y los cosméticos está en constante evolución, el equipo se centró en una posible estrategia para encontrar marcas indie, o de propiedad independiente, que sean innovadoras y populares entre el público y comprarlas. Por ello, el equipo construyó un módulo de identificación de marcas en los flujos de Twitter data que incluía una interfaz de etiquetado en el robado.

Para completar el proyecto, el equipo dividió el proceso en tres secciones:

  • Flujo de trabajo de la aplicación NER: consistente en el scraping de tweets relacionados con la belleza desde Twitter y la posterior extracción de entidades NER a partir de los contenidos de los posts.
  • Parte de etiquetado manual en Label Studio: tomándose el tiempo de etiquetar esos mismos puestos para comprobar si hay entidades omitidas o incorrectas 
  • Flujo de trabajo de formación NER: evaluar el modelo NER basado en el etiquetado para completar el flujo de trabajo si tiene éxito, o entrenar un nuevo modelo con data recién etiquetado si no tiene éxito

“Esta fue la primera vez que algún miembro de nuestro equipo utilizó Flyte, el equipo fue capaz de presentar tareas y flujos de trabajo muy rápidamente, gracias al intuitivo SDK (Software Development Kit) de la plataforma y a la documentación. Este Hackathon fue una experiencia increíble para que el equipo demostrara su experiencia avanzada en MLOps!”
dijo Robin Doumerc, ingeniero ML del Artefact.

Para ver la presentación completa en línea de Artefact de su proyecto ante el jurado de MLOps.community como parte de MLOps #98, siga el enlace aquí y salte a la marca de tiempo 41:22.