Artefact Research Center
De kloof tussen de academische wereld en de praktijk overbruggen.

Onderzoek naar transparantere en ethisch verantwoorde modellen om de acceptatie AI te bevorderen.

Voorbeelden van AI
- AppleCard verstrekt hypotheken op basis van racistische criteria
- Lensa AI selfies van vrouwen een seks AI
- Racistische afbeeldingen op Facebook waarin Afro-Amerikanen als apen worden afgebeeld
- De Twitter-chatbot van Microsoft gedraagt zich als een nazi, is seksistisch en agressief
- ChatGPT dat een code schrijft waarin staat dat goede wetenschappers blanke mannen zijn
Huidige uitdaging
AI zijn nauwkeurig en in veel toepassingen eenvoudig te implementeren, maar blijven onbeheersbaar vanwege hun ‘black box’-karakter en ethische kwesties.
De missieResearch Centerhet Artefact Research Center.
Een compleet ecosysteem dat de kloof overbrugt tussen
fundamenteel onderzoek en concrete industriële toepassingen.


Emmanuel MALHERBE
Hoofd Onderzoek
Onderzoeksgebied: Deep learning, machine learning
Emmanuel begon met een doctoraat in NLP-modellen voor e-recruitment en heeft altijd gestreefd naar een evenwicht tussen fundamenteel onderzoek en toepassingen met een grote impact. Zijn onderzoekservaring omvat onder meer 5G-tijdreeksvoorspellingen voor Huawei Technologies en computervisiemodellen voor klanten in de kappers- en make-upsector bij L’Oréal. Voordat hij bij Artefact in dienst trad, werkte hij in Shanghai als hoofd AI voor L’Oréal Asia. Zijn huidige functie bij Artefact de perfecte kans en een ideale omgeving om de kloof tussen de academische wereld en het bedrijfsleven te overbruggen, en om zijn praktijkgericht onderzoek te bevorderen terwijl hij tegelijkertijd invloed uitoefent op industriële toepassingen.
Lees ons laatsteResearch Center vanResearch Center Artefact Research Center
Transversale onderzoeksgebieden
Met onze unieke positie willen we algemene uitdagingen op het gebied van AI aanpakken, of het nu gaat om statistische modellering of managementonderzoek.
Deze vraagstukken lopen als een rode draad door al onze onderwerpen en vormen de basis voor ons onderzoek.
Een compleet ecosysteem dat de kloof overbrugt tussen fundamenteel onderzoek en concrete toepassingen in de industrie.

Onderwerpen
We werken aan verschillende promotieonderwerpen op het snijvlak van industriële toepassingen en de huidige technologische grenzen.
Voor elk onderwerp werken we samen met universiteitsdocenten en hebben we toegang tot industriële data we de belangrijkste onderzoeksgebieden binnen een bepaald praktijkgericht scenario kunnen aanpakken.
1 — Prognoses en prijsstelling
Modelleer de tijdreeks in zijn geheel met behulp van een aanpasbaar, multivariaat prognosemodel. Door deze modellering kunnen we de prijsstelling en promotieplanning aanpakken door de optimale parameters te vinden die de verkoopprognose verhogen. Met een dergelijke holistische benadering streven we ernaar om kannibalisatie en complementariteit tussen producten in kaart te brengen. Dit stelt ons in staat om de prognose te sturen met de garantie dat de voorspellingen consistent blijven.
2 — Een score die inzichtelijk en beheersbaar is
Een veelgebruikte familie van machine learning-modellen is gebaseerd op beslissingsbomen: random forests en boosting. Hoewel de nauwkeurigheid van deze modellen vaak toonaangevend is, hebben ze het nadeel dat ze als een ‘black box’ worden ervaren, waardoor de gebruiker slechts beperkte controle heeft. Wij streven ernaar de verklaarbaarheid en transparantie ervan te vergroten, doorgaans door de schatting van SHAP-waarden te verbeteren in het geval van onevenwichtige datasets. We streven er ook naar om bepaalde garanties te bieden voor dergelijke modellen, bijvoorbeeld voor samples buiten de training of door betere monotone beperkingen mogelijk te maken.
3 — Assortimentsoptimalisatie
Het productassortiment vormt een belangrijk zakelijk vraagstuk voor detailhandelaren bij het samenstellen van het aanbod dat in de winkels wordt verkocht. Met behulp van grote industriële datasets en neurale netwerken streven we ernaar robuustere en beter interpreteerbare modellen te ontwikkelen die een beter beeld geven van de keuzes die klanten maken wanneer ze voor een assortiment producten staan. Het aanpakken van kannibalisatie en complementariteit tussen producten, evenals een beter begrip van klantclusters, zijn essentieel voor het vinden van een optimaal productassortiment voor een winkel.
4 — AI in bedrijven
De uitdaging bij een betere implementatie van AI bedrijven bestaat er enerzijds in de AI te verbeteren en anderzijds inzicht te krijgen in de menselijke en organisatorische aspecten. Op het snijvlak van kwalitatief managementonderzoek en sociaal onderzoek tracht deze onderzoekslijn te achterhalen waar bedrijven tegen moeilijkheden aanlopen bij de implementatie AI . De bestaande kaders voor innovatie-implementatie zijn niet volledig geschikt voor innovaties op het gebied van machine learning, aangezien er bij AI – en in nog sterkere mate bij generatieve AI – typische verschillen bestaan op het vlak van regelgeving, opleiding van medewerkers of vooroordelen.
5 — Data duurzaamheid
Het project zal gebruikmaken van kwalitatieve en kwantitatieve onderzoeksmethoden en zich richten op twee kernvragen: Hoe kunnen bedrijven hun prestaties op het gebied van sociale en ecologische duurzaamheid effectief meten? Waarom leiden duurzaamheidsmaatregelen vaak niet tot wezenlijke veranderingen in de werkwijzen van organisaties?
Enerzijds heeft het project tot doel data maatstaven te onderzoeken en indicatoren vast te stellen om organisatorische procedures af te stemmen op doelstellingen op het gebied van sociale en ecologische duurzaamheid. Anderzijds zal het project zich richten op het omzetten van deze duurzaamheidsmaatregelen in concrete acties binnen bedrijven.
6 — Vooringenomenheid in computervisie
Wanneer een model een voorspelling doet op basis van een afbeelding, bijvoorbeeld van een gezicht, heeft het toegang tot gevoelige informatie, zoals etniciteit, geslacht of leeftijd, die zijn redenering kan beïnvloeden. Wij streven ernaar een raamwerk te ontwikkelen om dergelijke vooringenomenheid wiskundig te meten, en stellen methoden voor om deze vooringenomenheid tijdens het trainen van het model te verminderen. Bovendien zou onze aanpak statistisch gezien gebieden met sterke vooringenomenheid opsporen, zodat kan worden verklaard, begrepen en beheerst waar dergelijke modellen de in de data aanwezige vooringenomenheid versterken.
7 — LLM voor informatieverzameling
Een belangrijke toepassing van LLM’s is de koppeling met een corpus van documenten die bepaalde industriële kennis of informatie bevatten. In dat geval is er een fase van informatieverzameling, waarbij LLM’s enkele beperkingen vertonen, zoals de omvang van de invoertekst, die te klein is om documenten te indexeren. Ook kan het hallucinatie-effect zich voordoen in het uiteindelijke antwoord; we streven ernaar dit te detecteren aan de hand van het opgehaalde document en de onzekerheid van het model op het moment van de inferentie.
De parttime onderzoekers Artefact
Naast ons team dat zich volledig toelegt op onderzoek, hebben we verschillende medewerkers die een deel van hun tijd besteden aan wetenschappelijk onderzoek en het publiceren van artikelen. Doordat ze ook als adviseurs werken, worden ze geïnspireerd door de praktische problemen waarmee onze klanten te maken hebben.
Publicaties
Blogartikelen van gemiddelde lengte door onze tech-experts.
Zal de toekomst van agentgebaseerde AI van kennisgrafieken?
Nu bedrijven zich haasten om AI in de praktijk te brengen, komen de meesten tot de ontdekking dat hun data nooit is ontworpen voor autonoom redeneren. Tegenwoordig geldt voor maar liefst 80% van AI ...
De doe-het-zelf-ervaring verrijken: hoe ADEO AI inzet AI inhoud en kennis met elkaar te verbinden
Assortimentsoptimalisatie is een cruciaal proces in de detailhandel waarbij de ideale productmix wordt samengesteld om aan de vraag van de consument te voldoen, rekening houdend met de vele logistieke...
MotherDuck uitgelegd: hoe de AI analyseoplossing van de volgende generatie in uw Data past
MotherDuck breidt de analytische prestaties van DuckDB uit naar de cloud functies voor samenwerking, en biedt daarmee vier keer betere prestaties dan BigQuery en kostenbesparingen ten opzichte van traditionele data door middel van...
Assortimentsoptimalisatie met discrete-keuzemodellen in Python
Assortimentsoptimalisatie is een cruciaal proces in de detailhandel waarbij de ideale productmix wordt samengesteld om aan de vraag van de consument te voldoen, rekening houdend met de vele logistieke...
Is het afstemmen van voorkeuren altijd de beste optie om op LLM’s gebaseerde vertalingen te verbeteren? Een empirische analyse
Neurale maatstaven voor de evaluatie van machinevertaling (MT) winnen steeds meer aan belang vanwege hun betere correlatie met menselijke beoordelingen in vergelijking met traditionele lexicale maatstaven
Choice-Learn: Grootschalige keuzemodellering voor operationele contexten vanuit het perspectief van machine learning
Discrete-keuzemodellen zijn bedoeld om te voorspellen welke keuzes individuen maken uit een reeks alternatieven, ook wel een assortiment genoemd. Bekende toepassingen zijn onder meer het voorspellen van een...
Het tijdperk van generatieve AI: wat verandert er?
De vele en uiteenlopende reacties op ChatGPT en andere generatieve AI’s – of ze nu sceptisch of enthousiast zijn – laten zien welke veranderingen deze technologieën teweegbrengen en welke impact ze hebben...
Hoe Artefact een rechtvaardig en toch eenvoudig loopbaansysteem voor softwareontwikkelaars te ontwikkelen
In de dynamische en voortdurend veranderende tech-sector van vandaag kan een carrièrepad vaak aanvoelen als een kronkelend pad door een dichtbegroeid woud van mogelijkheden. Met de snelle...
Waarom u LLMOps nodig hebt
In dit artikel wordt LLMOps geïntroduceerd, een gespecialiseerde tak die DevOps en MLOps combineert om de uitdagingen aan te gaan die grote taalmodellen (LLM’s) met zich meebrengen...
De kracht van de LangChain Expression Language (LCEL) benutten: van proof of concept tot productie
LangChain is in minder dan een jaar uitgegroeid tot een van de meest gebruikte Python-bibliotheken voor interactie met LLM’s, maar LangChain was vooral een bibliotheek...
Hoe we profiel-ID’s hebben afgestemd met behulp van Treasure Data en SQL
In dit artikel lichten we de uitdagingen van ID-afstemming toe en laten we zien hoe wij te werk gaan om een uniforme profiel-ID te creëren in Data Customer Data , met name...
Snowflake’s Snowday ’23: op weg naar succes Data
Terwijl we terugblikken op de inzichten die tijdens het ‘Snowday’-evenement op 1 en 2 november werden gedeeld, volgt er een stroom van spannende onthullingen over de toekomst van...



















































