Vier teams van Data wetenschappers en software-ingenieurs van Artefact, experts in MLOps technologie, streden tegen hun collega's van over de hele wereld en wonnen deze twee weken durende internationale hackathon, waarvan het doel was om vectorzoekoplossingen te ontwikkelen met behulp van de arXiv wetenschappelijke papers dataset.

Het allereerste Vector Search Engineering Lab Hackathon werd gehouden van 24 oktober - 4 november 2022. De hackathon werd gezamenlijk georganiseerd door de MLOps Gemeenschap, Redis, NVIDIA Inception en Saturnuswolk en gecentreerd op Vector Search met behulp van de arXiv wetenschappelijke papers dataset. Vectorzoeken is een methode voor het indexeren en doorzoeken van grote hoeveelheden vectorinbeddingen om de dichtstbijzijnde buren voor een gegeven (gevectoriseerde) zoekopdracht te vinden.

Hoewel 88 deelnemers verdeeld over 20 teams meededen aan de wedstrijd, slaagden slechts 12 teams erin om hun inzendingen af te ronden. De winnaars verdienden niet alleen roem: ze namen ook geldprijzen, NVIDIA-producten, blogposts en sponsorgeld mee naar huis. U kunt een volledige beoordeling van de wedstrijdinzending vinden op de mlops.community blog.

De 1e plaats award ging naar de creatief genaamde Team Hackunamadata, bestaande uit de Artefactors Ali Bellamlih Mamou, Pol de Font-Réaulx, Benoit Bazouin en Hadrien DAURES. Hun winnende inzending was “arXiv Copilot”, een zoekassistent voor studenten of schrijvers van wetenschappelijke papers of recensies. AfXiv Copilot, een Chrome-extensie voor Google Docs, beveelt in realtime links aan naar gepubliceerde artikelen die gerelateerd zijn aan wat gebruikers aan het typen zijn. Zoekopties zijn onder andere aantal woorden, diepte van de tekstverzending en tekstverzameling per jaar en categorie. De voorgestelde links die door de engine worden geretourneerd, kunnen worden opgeslagen en later worden geraadpleegd - handig voor studenten die bijvoorbeeld aantekeningen maken tijdens colleges. U kunt hun demo voor meer informatie over hun winnende idee.

2e plaats ging naar Team AreYouRedis, waarvan de leden Ariel Eddie Guidi, Armand Kouyoumdjian, Robin Doumerc en Youssef Moutaouakil Oudghiri zijn. Hun “Darwinian Paper Explorer” is een zoekapplicatie die papers over een bepaald onderwerp vindt, niet alleen op onderwerp maar ook op jaar-op-jaar evolutie (vandaar de naam), en zelfs voorspelde toekomstige trends laat zien op basis van het aantal gepubliceerde papers; de app beveelt ook leeslijsten aan op basis van de volgorde van overeenkomst van het onderwerp. Bekijk hun video hier.

Twee andere Artefact teams werden geëerd:

  • Team THM, bestaande uit Henrique Brito, Tom Darmon, Michel Hua en Corentin Roineau nam de 4e prijs in ontvangst voor hun THM CLI-concept, waarmee onderzoekers papers direct vanaf hun terminal kunnen vinden in plaats van naar een website te gaan. Lees hun dag voor dag blog;
  • Team RedisPlayerOne (Hugo Vasselin, Amale El Hamri, Karim Si Larbi en Sacha Lasry) sleepte de 6e prijs in de wacht voor hun “AskYves” zoekmachine. Bekijk hun demo.
“Ik ben zo trots op onze getalenteerde mensen die de topposities innamen in een internationale MLOps hackathon waar alleen de beste data wetenschappers en software-ingenieurs meededen in deze zeer veeleisende discipline”,
Vincent Luciani, medeoprichter en CEO van Artefact.

De uitdaging voor elk team was om de arXiv-papers datasets en Redis als een in-memory vector database te gebruiken om een innovatieve, functionele vectorzoekmachine te maken die echte bedrijfswaarde kan creëren. “Onze MLOps-expertise gaf ons absoluut een voordeel voor het combineren van deze cross-functionele elementen”, merkte Robin Doumerc, Staff ML Engineer bij Artefact op “We brengen ditzelfde soort innovatie elke dag in de praktijk als we aan het werk zijn.”.

Inzendingen werden beoordeeld op een combinatie van technische bekwaamheid, de WOW-factor (creativiteit + uniekheid), het gebruik van vereiste technologieën (Redis Cloud, Saturn Cloud...) en kwaliteit + duidelijkheid van de documentatie. Teams moesten gebruik kunnen maken van tools en technieken zoals:

  • Zoeken naar vectorovereenkomst

  • NLP

  • Tekstverwerking

  • Kennisgrafieken

  • Documenten ophalen

  • Onderwerp Identificatie

  • Vragen en antwoorden

  • Aanbevelingssystemen

  • Data Visualisatie.

Er is een groeiende MLOps-community in Parijs waar ML-experts van over de hele wereld best practices uit de praktijk van Machine Learning Operations kunnen delen. Een van de belangrijkste onderwerpen betreft het in productie nemen en houden van Machine Learning-modellen.

In juni 2022, Amale El Hamri, Manager ML Engineer bij Artefact, sprak in samenwerking met Decathlon op de MLOps Wereld evenement in Toronto over het gebruik van MLOps-principes om hun bedrijf beter te sturen dankzij omzetvoorspellingen.

Als expert in data en AI richt Artefact zich steeds meer op MLOps en ML Engineering. Als onderdeel van deze focus speelt Artefact een grotere rol in de MLOps Community door samen te werken met de MLOps Parijs Meetup Gemeenschap in Meetups die zichtbaarheid geven aan lokale experts op dit gebied, en ons imago versterken als een bedrijf met expertise in de industrialisatie van ML-projecten.