Cuatro equipos de científicos del Data e ingenieros de software del Artefact, expertos en tecnología MLOps, compitieron contra sus homólogos de todo el mundo y ganaron este hackathon internacional de dos semanas de duración, cuyo objetivo era desarrollar soluciones de búsqueda vectorial utilizando los artículos académicos del arXiv dataset.

El primer laboratorio de ingeniería de búsqueda vectorial Hackathon se celebró del 24 de octubre al 4 de noviembre de 2022. El hackathon fue organizado conjuntamente por el Comunidad MLOps, Redis, NVIDIA Inception y Nube de Saturno y se centró en la búsqueda vectorial utilizando el Artículos académicos arXiv dataset. La búsqueda vectorial es un método de indexación y búsqueda a través de grandes volúmenes de incrustaciones vectoriales para encontrar los vecinos más cercanos a una consulta dada (vectorizada).

Aunque 88 participantes repartidos en 20 equipos se unieron a la competición, sólo 12 equipos consiguieron completar las presentaciones para su consideración. Los ganadores no sólo se llevaron la gloria: también se llevaron a casa premios en metálico, productos NVIDIA, artículos en el blog y botín de los patrocinadores. Puede encontrar una reseña completa de la presentación al concurso en el mlops.community blog.

El 1er puesto premio fue para el creativamente llamado Equipo Hackunamadata, compuesto por los Artefactors Ali Bellamlih Mamou, Pol de Font-Réaulx, Benoit Bazouin y Hadrien DAURES. Su propuesta ganadora fue “arXiv Copilot”, un asistente de búsqueda para estudiantes o escritores de artículos académicos o reseñas. Una extensión de Chrome para Google Docs, afXiv Copilot recomienda enlaces a artículos publicados relacionados con lo que los usuarios están escribiendo en tiempo real. Las opciones de búsqueda incluyen recuento de palabras, profundidad de envío del texto y recopilación de textos por año y categoría. Los enlaces sugeridos que devuelve el motor pueden guardarse y consultarse más tarde, lo que resulta útil para los estudiantes que toman apuntes durante las clases, por ejemplo. Puede ver sus demo para saber más sobre su idea ganadora.

2º puesto fue a Equipo AreYouRedis, cuyos miembros son Ariel Eddie Guidi, Armand Kouyoumdjian, Robin Doumerc y Youssef Moutaouakil Oudghiri. Su “Darwinian Paper Explorer” es una aplicación de búsqueda que encuentra artículos sobre un tema determinado no sólo por temas sino por evolución año a año (de ahí el nombre), mostrando incluso las tendencias futuras previstas en función del número de artículos publicados; la aplicación también recomienda listas de lectura en función del orden de similitud temática. Vea su vídeo aquí.

Otros dos equipos Artefact fueron galardonados:

  • El equipo THM, compuesto por Henrique Brito, Tom Darmon, Michel Hua y Corentin Roineau se llevó el 4º premio por su concepto THM CLI, que permite a los investigadores encontrar artículos directamente desde su terminal en lugar de ir a una página web. Lea su día a día blog;
  • El equipo RedisPlayerOne (Hugo Vasselin, Amale El Hamri, Karim Si Larbi y Sacha Lasry) se hizo con el sexto premio por su motor de búsqueda “AskYves”. Vea su demo.
“Estoy muy orgulloso de nuestro talentoso personal, que ocupó los primeros puestos en un hackathon internacional de MLOps en el que sólo los mejores científicos e ingenieros de software data compitieron en esta disciplina tan exigente”,
Vincent Luciani, cofundador y director general de Artefact.

El reto para cada equipo consistía en utilizar los documentos arXiv datasets y Redis como database de vectores en memoria para crear un motor de búsqueda vectorial innovador y funcional capaz de crear un valor empresarial real. “Nuestro Experiencia en MLOps nos dio definitivamente una ventaja para combinar estos elementos interfuncionales”, señaló Robin Doumerc, ingeniero de ML de Artefact. “Ponemos en práctica este mismo tipo de innovación todos los días cuando estamos trabajando”.

Las presentaciones fueron juzgadas por una combinación de Aptitud Técnica, el factor WOW (Creatividad + Singularidad), el uso de las tecnologías requeridas (Redis Cloud, Saturn Cloud...), y la Calidad + Claridad de la Documentación. Los equipos tenían que ser capaces de aprovechar herramientas y técnicas como:

  • Búsqueda por similitud vectorial

  • PNL

  • Minería de textos

  • Gráficos de conocimiento

  • Recuperación de documentos

  • Identificación de temas

  • Preguntas y respuestas

  • Sistemas de recomendación

  • Data Visualización.

Existe una creciente Comunidad MLOps en París que permite a los expertos en ML de todo el mundo compartir las mejores prácticas reales de Machine Learning Operations sobre el terreno. Uno de los temas más vitales tiene que ver con la puesta en producción de modelos de aprendizaje automático y su mantenimiento a lo largo del tiempo.

En junio de 2022, Amale El Hamri, Ingeniero ML Manager en Artefact, intervino en colaboración con Decathlon en la Mundo MLOps evento en Toronto sobre el uso de los principios MLOps para pilotar mejor su negocio gracias a las predicciones de facturación.

Como experto en data e IA, Artefact se está centrando cada vez más en MLOps y ML Engineering. Como parte de este enfoque, Artefact está desempeñando un papel más importante en la Comunidad MLOps colaborando con la Comunidad de Meetup de MLOps París en Meetups que aportarán visibilidad a los expertos locales en la materia, además de reforzar nuestra imagen de empresa experta en la industrialización de proyectos de ML.