Artefact Research Center

De kloof overbruggen tussen academische en industriële toepassingen.

Onderzoek naar transparantere en ethischere modellen om de adoptie van AI bedrijven te stimuleren.

Voorbeelden van AI vooroordelen

AppleCard verstrekt hypotheken op basis van racistische criteria
Lensa AI maakt selfies van vrouwen seksueel getint
Racistische Facebook Afbeelding Classificatie Met afro-amerikanen als apen
Twitter-chatbot van Microsoft wordt nazistisch, seksistisch en agressief
ChatGPT die een code schrijft waarin staat dat goede wetenschappers blanke mannen zijn

Huidige uitdaging

AI modellen zijn nauwkeurig en gemakkelijk in te zetten in veel gebruikssituaties, maar blijven oncontroleerbaar vanwege zwarte dozen en ethische kwesties.

De missie van Artefact Research Center .

Een compleet ecosysteem dat de kloof overbrugt tussen
fundamenteel onderzoek en tastbare industriële toepassingen.

Emmanuel MALHERBE

Hoofd onderzoek

Onderzoeksgebied: Diep leren, machinaal leren

Beginnend met een PhD over NLP-modellen aangepast aan e-recruitment, heeft Emmanuel altijd gezocht naar een efficiënte balans tussen puur onderzoek en impactvolle toepassingen. Zijn onderzoekservaring omvat het voorspellen van 5G-tijdreeksen voor Huawei Technologies en computervisiemodellen voor kappers- en make-upklanten bij l'Oréal. Voordat hij bij Artefact kwam, werkte hij in Shanghai als hoofd van AI onderzoek voor L'Oréal Azië. Vandaag de dag is zijn positie op Artefact een perfecte gelegenheid en een ideale omgeving om de kloof tussen de academische wereld en de industrie te overbruggen, en om zijn onderzoek in de echte wereld te stimuleren terwijl het een impact heeft op industriële toepassingen.

Een volledig ecosysteem dat de kloof overbrugt tussen fundamenteel onderzoek en tastbare industriële toepassingen.

Transversale onderzoeksgebieden

Met onze unieke positionering richten we ons op algemene uitdagingen van AI, of het nu gaat om statistische modellering of managementonderzoek.
Deze vragen zijn transversaal voor al onze onderwerpen en voeden ons onderzoek.

Controle &
verantwoording

Controleerbare modellen met garanties op voorspellingen
Interface met vraagplanners
Categorie managers
Beslissing door beste modelinput: betrouwbare voorspelling afdwingen, zelfs uit treinset
Bijvoorbeeld: Monotonie afdwingen op invoervariabelen

Uitlegbaarheid
& transparantie

Interpretatie van voorspellingen
Interface en visualisatie voor niet-technische gebruikers
De modules en componenten van de modellen aanpassen aan metiers
Visualisatie op begrijpelijke input, vóór feature engineering

Vertekening &
onzekerheid

Verrijk voorspellingen voor betere beslissingen
Niet-symmetrische onzekerheid (vs Gaussisch) vereist door klanten
Aangepast aan tijdreeksen en assortimentsoptimalisatie

Belemmeringen & versnellers van AI in bedrijven

Studie van organisaties
Top CAC 40 belanghebbenden en besluitvormers interviews
Impact van AI ethiek, eerlijkheid, interpreteerbaarheid
Governance, normen en voorschriften voor AI toepassingen

Onderwerpen

We werken aan verschillende PhD-onderwerpen op het snijvlak van industriële use cases en state-of-the-art beperkingen.
Voor elk onderwerp werken we samen met universiteitsprofessoren en hebben we toegang tot industrieel data waarmee we de belangrijkste onderzoeksgebieden in een gegeven scenario in de echte wereld kunnen aanpakken.

1 - Prognose en prijsstelling

Tijdreeksen als geheel modelleren met een controleerbaar, multivariaat voorspellingsmodel. Met een dergelijk model kunnen we de prijs- en promotieplanning aanpakken door de optimale parameters te vinden die de verkoopprognose verhogen. Met zo'n holistische benadering willen we kannibalisatie en complementariteit tussen producten vastleggen. Hierdoor kunnen we de voorspelling controleren met de garantie dat de voorspellingen consistent blijven.

Mohamed CHTIBA

Onderzoekswetenschapper
over prognose en prijsstelling

Onderzoeksgebied
-
Diep Leren, Optimalisatie, Statistiek

Jean-Marc BARDET

Professor

Laboratorium SAMM

Scholar pagina

Onderzoeksgebied
-
Stochastische processen, statistiek, waarschijnlijkheid

Joseph RYNKIEWICZ

Universitair hoofddocent

Laboratorium SAMM

Scholar pagina

Onderzoeksgebied
-
Tijdreeksen, Neurale Netwerken, Statistiek

2 - Verklaarbare en controleerbare scores

Een veelgebruikte familie van machine-learning modellen is gebaseerd op beslisbomen: random forests, boosting. Hoewel hun nauwkeurigheid vaak state of the art is, lijden dergelijke modellen aan een black-box gevoel, waardoor de gebruiker beperkte controle heeft. We willen de verklaarbaarheid en transparantie ervan vergroten, met name door de schatting van SHAP-waarden te verbeteren in het geval van ongebalanceerde datasets. We streven er ook naar om bepaalde garanties te bieden voor dergelijke modellen, bijvoorbeeld voor monsters die niet getraind zijn of door betere monotone beperkingen mogelijk te maken.

Abdoulaye SAKHO

Onderzoekswetenschapper op
Boomgebaseerde modellen

Onderzoeksgebied
-
Statistiek, verklaarbaar AI

Erwan SCORNET

Professor

Laboratorium LPSM

Studentenpagina

Onderzoeksgebied
-
Random forests, Interpretabiliteit, Ontbrekende waarden

3 - Assortimentoptimalisatie

Assortiment is een belangrijk bedrijfsprobleem voor retailers dat zich voordoet bij het selecteren van de set producten die in winkels verkocht worden. Met behulp van grote industriële datasets en neurale netwerken willen we robuustere en beter interpreteerbare modellen bouwen die de keuze van de klant beter weergeven wanneer deze geconfronteerd wordt met een assortiment producten. Omgaan met kannibalisatie en complementariteit tussen producten, evenals een beter begrip van klantenclusters, zijn de sleutel tot het vinden van een meer optimale set producten in een winkel.

Vincent AURIAU

Onderzoekswetenschapper voor assortimentsoptimalisatie

Onderzoeksgebied
-
Diep leren,
Operationeel onderzoek

Vincent MOUSSEAU

Professor

Laboratorium MICS

Student Pagina

Onderzoeksgebied
-
Leren van voorkeuren, multicriteria beslissingsanalyse, operationeel onderzoek

Antoine DESIR

Universitair hoofddocent

Laboratorium TOM

Studentenpagina

Onderzoeksgebied
-
Keuzemodellering, Assortimentsoptimalisering, Operationeel onderzoek

Ali AOUAD

Assistent-professor

Managementwetenschappen en bedrijfsvoering

DBLP Pagina

Onderzoeksgebied
-
Dynamische matching, keuzemodellering, assortiments- en voorraadoptimalisering, algoritme voor benaderingen, operationeel onderzoek

4 - AI Adoptie in bedrijven

De uitdaging van een betere toepassing van AI in bedrijven bestaat enerzijds uit het verbeteren van de AI modellen en anderzijds uit het begrijpen van de menselijke en organisatorische aspecten. Op het kruispunt van kwalitatief managementonderzoek en sociaal onderzoek probeert deze as te onderzoeken waar bedrijven moeilijkheden ondervinden bij de adoptie van AI tools. De bestaande kaders voor de adoptie van innovaties zijn niet helemaal geschikt voor innovaties op basis van machinaal leren, omdat er typische verschillen zijn met regelgeving, opleiding van mensen of vooroordelen als het gaat om AI, en meer nog met generatieve AI.

Lara ABDEL HALIM

Wetenschappelijk onderzoek naar AI adoptie in bedrijven

Onderzoeksgebied
-
Managementonderzoek, Innovatie

Cécile CHAMARET

Professor

Laboratorium CRG

Studentenpagina

Onderzoeksgebied
-
Innovatie, Marketing, Kwalitatief Sociaal Onderzoek

5 - Data duurzaamheid

Het project maakt gebruik van kwalitatieve en kwantitatieve onderzoeksmethoden en richt zich op twee belangrijke vragen: Hoe kunnen bedrijven effectief sociale en ecologische duurzaamheidsprestaties meten? Waarom leiden duurzaamheidsmaatregelen vaak niet tot significante veranderingen in organisatiepraktijken?

Enerzijds is het project gericht op het verkennen van data meetmethoden en het identificeren van indicatoren om organisatorische procedures af te stemmen op sociale en ecologische duurzaamheidsdoelstellingen. Anderzijds zal het project zich richten op het omzetten van deze duurzaamheidsmaatregelen in concrete acties binnen bedrijven.

Oualid Mokhantar

Onderzoekswetenschapper Duurzaamheid

Onderzoeksgebied
-
Managementonderzoek, Economie

Gorgi KRLEV

Universitair hoofddocent

Afdeling Duurzaamheid

Studentenpagina

Onderzoeksgebied
-
Duurzaamheid, Sociale innovatie, Organisatietheorie

6 - Vertekening in computervisie

Wanneer een model een voorspelling doet op basis van een afbeelding, bijvoorbeeld van een gezicht, heeft het toegang tot gevoelige informatie, zoals de etniciteit, het geslacht of de leeftijd, die zijn redenering kan beïnvloeden. We willen een raamwerk ontwikkelen om deze vertekening wiskundig te meten en methodes voorstellen om deze vertekening tijdens de modeltraining te verminderen. Bovendien zou onze aanpak zones met een sterke vertekening statistisch detecteren om te verklaren en te begrijpen en te controleren waar dergelijke modellen de vertekening die aanwezig is in de data versterken.

Veronika SCHILOVA

Onderzoekswetenschapper naar vooroordelen in computer vision

Onderzoeksgebied
-
Diep leren, computervisie, vooroordelen

Laurent RISSER

CNRS Onderzoeksingenieur

Instituut voor wiskunde van Toulouse

Studentenpagina

Onderzoeksgebied
-
Verklaarbaar machinaal leren, beeldanalyse, interpreteerbaar en robuust AI

Jean-Michel LOUBES

Professor

Instituut voor wiskunde van Toulouse

Studentenpagina

Onderzoeksgebied
-
Onbevooroordeeld leren, interpreteerbaar AI, optimaal transport en toepassingen voor statistiek, machinaal leren

7 - LLM voor het opzoeken van informatie

Een belangrijke toepassing van LLM's is wanneer ze gekoppeld worden aan een corpus van documenten die bepaalde industriële kennis of informatie vertegenwoordigen. In zo'n geval is er een stap van het ophalen van informatie, waarvoor LLM's enkele beperkingen hebben, zoals de grootte van de invoertekst, die te klein is om documenten te indexeren. Op dezelfde manier kan het hallucinatie-effect ook optreden in het uiteindelijke antwoord, dat we proberen te detecteren met behulp van het opgehaalde document en de modelonzekerheid op het moment van inferentie.

Hippolyte GISSEROT-BOUKHLEF

Onderzoekswetenschapper naar grote taalmodellen voor informatieherwinning

Onderzoeksgebied
-
Diep leren, NLP

Pierre COLOMBO

Universitair hoofddocent

Laboratorium MICS

Studentenpagina

Onderzoeksgebied
-
Grote taalmodellen, bias in AI, Modelevaluatie

Céline HUDELOT

Professor

Laboratorium MICS

Studentenpagina

Onderzoeksgebied
-
Kennisrepresentatie, Semantische interpretatie, Neurale netwerken

Artefactparttime onderzoekers

Naast ons team dat zich bezighoudt met onderzoek, hebben we verschillende medewerkers die enige tijd besteden aan wetenschappelijk onderzoek en het publiceren van artikelen. Door ook als consultant te werken, inspireren we hen met problemen die onze klanten in de praktijk tegenkomen.

Michael Voelske

Onderzoeksgebied

Grote taalmodellen toepassingen in informatieherwinning en NLP

Verklaarbare modellen in machinaal leren, zoeken en rangschikken

IR voor complexe, taakgebaseerde informatiebehoeften

Sinds mei 2022 sta ik aan het roer van het Data Science and Engineering team bij Artefact Duitsland, waar ik mijn academische achtergrond in computerwetenschappen, met een PhD gericht op machine learning en information retrieval, toepas op het oplossen van de zakelijke problemen van Artefact's klanten. Mijn rol bestaat niet alleen uit het leiden maar ook uit het inspireren van mijn team om baanbrekend AI onderzoek te combineren met pragmatische toepassingen. Gepassioneerd over het toegankelijk maken van complexe AI concepten, streef ik ernaar om technologie te gebruiken voor zowel innovatieve zakelijke oplossingen als zinvolle maatschappelijke impact.
Evan Hurwitz

Onderzoeksgebied

Versterking leren

Machinaal leren

Financiën en gokken

Evan heeft een PhD Engineering in artificial intelligence waar hij AI technieken toepaste om een actief beheerde portefeuille met meerdere handelsstrategieën te optimaliseren. Hij heeft onderzoekswerk verricht in de academische wereld, waar hij co-auteur was van "Artificial Intelligence and Economic Theory: Skynet in de markt". Later werkte hij aan groene energieoplossingen met behulp van reinforcement learning voor S&P Platts, waarna hij bij Preqin werkte aan het opnemen en begrijpen van alternatieve investeringen data. In 2020 trad hij in dienst bij Artefact en werkte hij in verschillende sectoren, zoals detailhandel, cyberbeveiliging, SaaS, techniek, onderwijs en vastgoed, met klanten variërend van KMO's tot FTSE100-bedrijven.
George Cevora

Onderzoeksgebied

Neurowetenschappen

Diep leren

Machinaal leren

George behaalde zijn Ph.D. in Theoretische Neurowetenschappen aan de Universiteit van Cambridge voor zijn werk aan de wiskundige modellering van dierlijk leren. George heeft 10 jaar onderzoekservaring in deep learning, die hij nu toepast in industriële omgevingen. Sinds hij de academische wereld heeft verlaten, heeft George gewerkt in een breed scala aan industrieën en probleemdomeinen, van straalmotoren tot antibioticaresistentie. George heeft ook een paar jaar gewerkt op het gebied van nationale veiligheid, waar hij een product heeft ontwikkeld om discriminatie als gevolg van het onjuiste gebruik van AI tegen te gaan. Meer informatie is te vinden op www.cevora.xyz.
Savio Rozario

Onderzoeksgebied

Machinaal leren

Niet-lineaire optimalisatie

Natuurkunde

Savio heeft een Ph.D. in experimentele laserplasmafysica van het Imperial College in Londen, waar hij machine learning-methoden gebruikte om de experimentele configuratie van sterk niet-lineaire plasmaversnellersystemen te optimaliseren. Hij werkte bij EY op hun belasting R&D afdeling, waar hij machine learning oplossingen ontwikkelde voor compliance monitoring in meerdere regio's met behulp van grote taalmodellen. In 2022 trad hij in dienst bij Artefact en heeft hij end-to-end data science-oplossingen geleverd in verschillende sectoren, waaronder retail, transport en vastgoed voor FTSE250-organisaties.
Nelson Vrede

Nelson bracht het eerste decennium van zijn carrière door in een combinatie van aandelen- en grondstoffenmarkten, waar hij kwantitatieve handelsstrategieën inzette in OTC-markten. Na afronding van zijn MSc in Data Science in 2021 trad hij in dienst bij Artefact's Britse kantoor als data scientist, waar hij werkt aan data wetenschappelijke problemen in een reeks domeinen, met expertise in AI toepassingen in financiële markten en handel.

Publicaties

- Khalid Al Khatib, Michael Voelske, Anh Le, Shahbaz Syed, Martin Potthast en Benno Stein."Een nieuwe dataset voor causaliteitsidentificatie in argumentatieve teksten.", In Proceedings of the 24th Meeting of the Special Interest Group on Discourse and Dialogue (SIGDIAL), ACL (2023).
- Glen Hopkins en Kristjan Kalm. "Classificeren van complexe documenten: Vergelijking van op maat gemaakte oplossingen met grote taalmodellen"arXiv preprint arXiv:2312.07182 (2023)
- Olivier Turnbull en George Cevora. "Instabiliteit van computervisiemodellen is een noodzakelijk gevolg van de taak zelf."arXiv preprint arXiv:2310.17559 (2023).
- Marcel Marais, Máté Hartstein en George Čevora, "Gebruik van lineaire initialisatie om de convergentiesnelheid en volledig getrainde fout in auto-encoders te verbeteren." arXiv preprint arXiv:2311.10699 (2023).
- Evan Hurwitz, Nelson Peace en George Cevora. "Achieving Stable Training of Reinforcement Learning Agents in Bimodal Environments through Batch Learning."ArXiv preprint arXiv:2307.00923 (2023).
- Savio Rozario en George Čevora. "Explainable AI geeft niet de uitleg waar eindgebruikers om vragen." arXiv preprint arXiv:2302.11577 (2023).
- Vincent Auriau, Emmanuel Malherbe en Matthieu Perrot. "Zwakke segmentatie-geleide GAN voor realistische kleureneditie." In International Conference on Image Analysis and Processing, Springer Nature Switzerland, (2023).
- Maté Hartstein en George Čevora. "Data methode voor het navigeren over de Atlantische Oceaan in een roeiwedstrijd".
- Evan Hurwitz en George Čevora. "Voorspelling van de prestaties van herscholingsprogramma's voor werknemers."arXiv preprint arXiv:2107.10001 (2021).

Medium blogartikelen van onze technische experts.

Assortimentoptimalisatie met discrete keuzemodellen in Python

Assortimentoptimalisatie is een cruciaal proces in de detailhandel waarbij de ideale mix van producten wordt samengesteld om aan de vraag van de consument te voldoen, rekening houdend met de vele logistieke...

Is Preference Alignment altijd de beste optie om LLM-gebaseerd vertalen te verbeteren? Een empirische analyse

Neurale meetmethoden voor de evaluatie van machinevertaling (MT) worden steeds prominenter vanwege hun superieure correlatie met menselijke beoordelingen in vergelijking met traditionele lexicale meetmethoden.

Keuze-leren: Grootschalige keuzemodellering voor operationele contexten door de lens van machinaal leren

Discrete keuzemodellen zijn gericht op het voorspellen van keuzebeslissingen die individuen maken uit een menu van alternatieven, een zogenaamd assortiment. Bekende toepassingen zijn het voorspellen van een...

Het tijdperk van generatieve AI: Wat verandert er?

De overvloed en diversiteit van reacties op ChatGPT en andere generatieve AI's, of ze nu sceptisch of enthousiast zijn, tonen de veranderingen die ze teweegbrengen en de impact...

Hoe Artefact erin slaagde een eerlijk maar eenvoudig carrièresysteem voor software-ingenieurs te ontwikkelen

In de dynamische en steeds veranderende technologiesector van vandaag kan een carrièrepad vaak aanvoelen als een kronkelend pad door een dicht woud van mogelijkheden. Met snelle...

Waarom je LLMOps nodig hebt

Dit artikel introduceert LLMOps, een gespecialiseerde tak die DevOps en MLOps samenvoegt om de uitdagingen van Large Language Models (LLM's) aan te gaan...

De kracht van LangChain Expression Language (LCEL) ontketenen: van proof of concept naar productie

LangChain is in minder dan een jaar uitgegroeid tot een van de meest gebruikte Python-bibliotheken voor interactie met LLM's, maar LangChain was vooral een bibliotheek...

Hoe we de reconciliatie van profiel-ID's afhandelden met behulp van Treasure Data Unification en SQL

In dit artikel leggen we de uitdagingen van ID-reconciliatie uit en demonstreren we onze aanpak om een eenduidig profiel-ID te maken in het Customer Data Platform,...

Snowflake's Snowday '23: Snowballing into Data Wetenschappelijk succes

Terwijl we nadenken over de inzichten die zijn gedeeld tijdens het 'Snowday'-evenement op 1 en 2 november, is er een stroom van spannende onthullingen over de toekomst van...

Hoe we software engineers interviewen en aannemen bij Artefact

We bespreken de vaardigheden waarnaar we op zoek zijn, de verschillende stappen van het proces en de beloften die we aan alle kandidaten doen.

Het coderen van categorische kenmerken in voorspellingen: doen we het allemaal verkeerd?

We stellen een nieuwe methode voor om categorische kenmerken te coderen die specifiek is afgestemd op voorspellingstoepassingen.

Hoe we een eenvoudig bewakingssysteem voor wilde dieren implementeerden op Google Cloud

We hebben samengewerkt met Smart Parks, een Nederlandse organisatie die geavanceerde sensoroplossingen biedt voor het behoud van bedreigde wilde dieren...

Artefact Research Center

De kloof overbruggen tussen academische en industriële toepassingen.

Onderzoek naar transparantere en ethischere modellen om de adoptie van AI bedrijven te stimuleren.

Voorbeelden van AI vooroordelen

Huidige uitdaging

De missie van Artefact Research Center .

Een volledig ecosysteem dat de kloof overbrugt tussen fundamenteel onderzoek en tastbare industriële toepassingen.

Transversale onderzoeksgebieden

Controle & verantwoording

Uitlegbaarheid & transparantie

Vertekening & onzekerheid

Belemmeringen & versnellers van AI in bedrijven

Onderwerpen

1 - Prognose en prijsstelling

2 - Verklaarbare en controleerbare scores

3 - Assortimentoptimalisatie

4 - AI Adoptie in bedrijven

5 - Data duurzaamheid

6 - Vertekening in computervisie

7 - LLM voor het opzoeken van informatie

Artefactparttime onderzoekers

Publicaties

Medium blogartikelen van onze technische experts.

Controle &
verantwoording

Uitlegbaarheid
& transparantie

Vertekening &
onzekerheid