Artefact Research Center

Faire le lien entre le monde universitaire et les applications industrielles.

class="lazyload
class="lazyload

Recherche sur des modèles plus transparents et plus éthiques visant à favoriser l'adoption de l'IA par les entreprises.

ARTEFACT RESEARCH CENTER

Exemples de biais dans l'IA

  • AppleCard accorde des prêts immobiliers sur la base de critères racistes
  • Lensa AI sexualise les selfies des femmes
  • Classification raciste d'images sur Facebook représentant des Afro-Américains sous les traits de singes
  • Le chatbot Twitter de Microsoft devient nazi, sexiste et agressif
  • ChatGPT qui écrit un code affirmant que les bons scientifiques sont des hommes blancs

Défi actuel

Les modèles d'IA sont précis et faciles à mettre en œuvre dans de nombreux cas d'utilisation, mais restent incontrôlables en raison du caractère opaque de leur fonctionnement et des questions éthiques qu'ils soulèvent.

La missionResearch Center Artefact .

Un écosystème complet qui comble le fossé entre la recherche fondamentale en
et les applications industrielles concrètes.

La missionResearch Center Artefact .
Emmanuel MALHERBE

Emmanuel MALHERBE

Responsable de la recherche

Domaine de recherche : apprentissage profond, apprentissage automatique

Après avoir obtenu un doctorat sur les modèles de TALN adaptés au recrutement en ligne, Emmanuel a toujours cherché à trouver un juste équilibre entre la recherche fondamentale et les applications concrètes. Son expérience en recherche comprend notamment des prévisions de séries chronologiques en 5G pour Huawei Technologies et des modèles de vision par ordinateur destinés aux clients des salons de coiffure et de maquillage chez L’Oréal. Avant de rejoindre Artefact, il a occupé à Shanghai le poste de responsable de la recherche en IA pour L’Oréal Asie. Aujourd’hui, son poste chez Artefact une opportunité parfaite et un environnement idéal pour faire le lien entre le monde universitaire et l’industrie, et pour développer ses recherches ancrées dans la réalité tout en ayant un impact sur les applications industrielles.

Lisez notre dernière éditionResearch Center Artefact

Domaines de recherche transversaux

Grâce à notre positionnement unique, nous nous attachons à relever les défis généraux liés à l'IA, qu'il s'agisse de modélisation statistique ou de recherche en gestion.
Ces questions sont transversales à toutes nos disciplines et nourrissent nos travaux de recherche.

Contrôle et responsabilité

Contrôle et
responsabilité

  • Modèles contrôlables offrant des garanties sur les prédictions
  • Collaboration avec les responsables de la planification de la demande
  • Responsables de catégorie
  • Décision basée sur les données d'entrée du meilleur modèle : garantir une prédiction fiable même en dehors de l'ensemble d'apprentissage
  • Par exemple : imposer la monotonie aux variables d'entrée
Explicabilité et transparence

Explicabilité
& transparence

  • Interprétation des prévisions
  • Interface et visualisation destinées aux utilisateurs non initiés
  • Adapter les modules et les composants des modèles aux métiers
  • Visualisation à partir de données compréhensibles, avant le traitement des caractéristiques
Biais et incertitude

Biais et
incertitude

  • Améliorer les prévisions pour prendre de meilleures décisions
  • Incertitude non symétrique (par opposition à l'incertitude gaussienne) requise par les clients
  • Adapté à l'optimisation des séries chronologiques et des gammes de produits
Obstacles et catalyseurs de l'IA dans le monde des affaires

Obstacles et catalyseurs de l'IA dans le monde des affaires

  • Étude des organisations
  • Entretiens avec les principaux acteurs et décideurs du CAC 40
  • Impact de l'éthique, de l'équité et de l'interprétabilité de l'IA
  • Gouvernance, normes et réglementations relatives aux applications d'IA

Un écosystème complet qui fait le lien entre la recherche fondamentale et les applications concrètes dans l'industrie.

Un écosystème complet qui fait le lien entre la recherche fondamentale et les applications concrètes dans l'industrie.

Matières

Nous travaillons sur plusieurs sujets de thèse à la croisée des cas d'utilisation industriels et des limites actuelles de la technologie.
Pour chaque sujet, nous collaborons avec des professeurs d'université et avons accès à data industrielles data nous permettent d'aborder les principaux axes de recherche dans un scénario concret donné.

1 — Prévisions et tarification

Modéliser les séries chronologiques dans leur ensemble à l'aide d'un modèle de prévision multivarié et contrôlable. Cette modélisation nous permettra d'aborder la tarification et la planification des promotions en déterminant les paramètres optimaux qui augmentent les prévisions de ventes. Grâce à cette approche globale, nous visons à prendre en compte la cannibalisation et la complémentarité entre les produits. Cela nous permettra de contrôler les prévisions tout en garantissant la cohérence des prévisions.

Mohamed CHTIBA

Mohamed CHTIBA


, chercheur scientifique spécialisé dans les prévisions et la tarification

Artefact
Université Paris 1 Panthéon-Sorbonne

Domaines de recherche

Apprentissage profond, optimisation, statistiques

Jean-Marc BARDET

Jean-Marc BARDET

Professeur

Laboratoire SAMM

Université Paris 1 Panthéon-Sorbonne

Domaines de recherche

Processus stochastiques, statistiques, probabilités

Joseph RYNKIEWICZ

Joseph RYNKIEWICZ

Professeur associé

Laboratoire SAMM

Université Paris 1 Panthéon-Sorbonne

Domaine de recherche

Séries chronologiques, réseaux neuronaux, statistiques

2 — Un système de notation explicable et contrôlable

Une famille très répandue de modèles d'apprentissage automatique repose sur les arbres de décision : les forêts aléatoires et le boosting. Bien que leur précision soit souvent à la pointe de la technologie, ces modèles souffrent d'un manque de transparence, ce qui limite le contrôle dont dispose l'utilisateur. Notre objectif est d'améliorer leur explicabilité et leur transparence, généralement en affinant l'estimation des valeurs SHAP dans le cas d'ensembles de données déséquilibrés. Nous visons également à fournir certaines garanties pour ces modèles, par exemple pour les échantillons hors entraînement ou en permettant de meilleures contraintes monotones.

Abdoulaye SAKHO

Abdoulaye SAKHO

Chercheur enmodèles arborescents sur

Artefact
Sorbonne Université

Domaines de recherche

Statistiques, IA explicable

Erwan SCORNET

Erwan SCORNET

Professeur

Laboratoire LPSM

Sorbonne Université

Domaine de recherche

Forêts aléatoires, interprétabilité, valeurs manquantes

3 — Optimisation de l'assortiment

La composition de l'assortiment constitue un enjeu commercial majeur pour les détaillants, qui se pose lors du choix de l'ensemble des produits à vendre en magasin. À l'aide de vastes ensembles de données industrielles et de réseaux neuronaux, nous cherchons à développer des modèles plus robustes et plus interprétables, capables de mieux refléter les choix des clients face à un assortiment de produits. La prise en compte de la cannibalisation et des complémentarités entre les produits, ainsi qu'une meilleure compréhension des segments de clientèle, sont essentielles pour déterminer l'assortiment de produits le plus optimal pour un magasin.

Vincent AURIAU

Vincent AURIAU

Chercheur en optimisation de l'assortiment

Artefact
Centrale Supélec
Université Paris-Saclay

Domaines de recherche

Apprentissage profond,
Recherche opérationnelle

Vincent MOUSSEAU

Vincent MOUSSEAU

Professeur

Laboratoire MICS

Centrale Supélec
Université Paris-Saclay

Domaines de recherche

Apprentissage des préférences, analyse décisionnelle multicritères, recherche opérationnelle

Antoine DESIR

Antoine DESIR

Professeur associé

Laboratoire TOM

INSEAD

Domaine de recherche

Modélisation des choix, optimisation de l'assortiment, recherche opérationnelle

Ali AOUAD

Ali AOUAD

Maître de conférences

Science de gestion et opérations

London Business School

Domaine de recherche

Appariement dynamique, modélisation des choix, optimisation de l'assortiment et des stocks, algorithmes d'approximation, recherche opérationnelle

4 — L'adoption de l'IA dans les entreprises

Le défi d'une meilleure adoption de l'IA dans les entreprises consiste, d'une part, à améliorer les modèles d'IA et, d'autre part, à comprendre les aspects humains et organisationnels. À la croisée de la recherche qualitative en gestion et de la recherche sociale, cet axe vise à explorer les difficultés rencontrées par les entreprises lors de l'adoption d'outils d'IA. Les cadres théoriques existants sur l'adoption de l'innovation ne sont pas entièrement adaptés aux innovations en matière d'apprentissage automatique, car il existe des différences caractéristiques en matière de réglementation, de formation du personnel ou de biais lorsqu'il s'agit d'IA, et ce d'autant plus avec l'IA générative.

Lara ABDEL HALIM

Lara ABDEL HALIM

Chercheur spécialisé dans l'adoption de l'IA par les entreprises

Artefact
École Polytechnique

Domaine de recherche

Recherche en gestion, Innovation

Cécile CHAMARET

Cécile CHAMARET

Professeur

Laboratoire CRG

École Polytechnique

Domaines de recherche

Innovation, marketing, recherche sociale qualitative

5 — Développement durable Data

Ce projet fera appel à des méthodes de recherche qualitatives et quantitatives et s'attachera à répondre à deux questions fondamentales : comment les entreprises peuvent-elles mesurer efficacement leurs performances en matière de durabilité sociale et environnementale ? Pourquoi les mesures de durabilité ne parviennent-elles souvent pas à induire des changements significatifs dans les pratiques organisationnelles ?

D'une part, le projet vise à étudier des indicateurs data et à identifier des repères permettant d'aligner les procédures organisationnelles sur les objectifs de durabilité sociale et environnementale. D'autre part, le projet s'attachera à traduire ces mesures de durabilité en actions concrètes au sein des entreprises.

Oualid Mokhantar

Oualid Mokhantar

Chercheur en développement durable

Artefact
ESCP Business School

Domaines de recherche

Recherche en gestion, Économie

Gorgi KRLEV

Gorgi KRLEV

Professeur associé

Département du développement durable

ESCP Business School

Domaines de recherche

Développement durable, innovation sociale, théorie des organisations

6 — Les biais dans la vision par ordinateur

Lorsqu'un modèle émet une prédiction à partir d'une image, par exemple celle d'un visage, il a accès à des informations sensibles, telles que l'origine ethnique, le sexe ou l'âge, qui peuvent biaiser son raisonnement. Notre objectif est de développer un cadre permettant de mesurer mathématiquement ce biais, et de proposer des méthodologies pour le réduire pendant l'entraînement du modèle. De plus, notre approche permettrait de détecter statistiquement les zones de fort biais afin d'expliquer, de comprendre et de contrôler les endroits où ces modèles renforcent le biais présent dans les data.

Veronika SHILOVA

Veronika SHILOVA

Chercheur spécialisé dans les biais en vision par ordinateur

Artefact
Université Toulouse III

Domaine de recherche

Apprentissage profond, vision par ordinateur, biais

Laurent RISSER

Laurent RISSER

Ingénieur de recherche au CNRS

Institut des mathématiques de Toulouse

Université Toulouse III
CNRS

Domaines de recherche

Apprentissage automatique explicable, analyse d'images, IA interprétable et robuste

Jean-Michel LOUBES

Jean-Michel LOUBES

Professeur

Institut des mathématiques de Toulouse

Université Toulouse III
ANITI

Domaines de recherche

Apprentissage non biaisé, IA interprétable, transport optimal et applications aux statistiques et à l'apprentissage automatique

7 — LLM pour la recherche d'informations

L'une des principales applications des modèles de langage à grande échelle (LLM) consiste à les associer à un corpus de documents contenant des connaissances ou des informations sectorielles. Dans ce cas, une étape de recherche d'informations est nécessaire, pour laquelle les LLM présentent certaines limites, telles que la taille du texte d'entrée, qui est trop réduite pour permettre l'indexation des documents. De même, un effet d'hallucination peut également se produire dans la réponse finale, que nous cherchons à détecter en nous appuyant sur le document récupéré et sur l'incertitude du modèle au moment de l'inférence.

Hippolyte Gisserot-Bouklef

Hippolyte Gisserot-Bouklef

Chercheur spécialisé dans les grands modèles linguistiques pour la recherche d'informations

Artefact
Centrale Supélec
Université Paris-Saclay

Domaines de recherche

Apprentissage profond, Traitement du langage naturel

Pierre COLOMBO

Pierre COLOMBO

Professeur associé

Laboratoire MICS

Centrale Supélec
Université Paris-Saclay

Domaines de recherche

Grands modèles linguistiques, biais dans l'IA, évaluation des modèles

Céline HUDELOT

Céline HUDELOT

Professeur

Laboratoire MICS

Centrale Supélec
Université Paris-Saclay

Domaines de recherche

Représentation des connaissances, interprétation sémantique, réseaux neuronaux

Les chercheurs à temps partiel Artefact

Outre notre équipe dédiée à la recherche, nous comptons plusieurs collaborateurs qui consacrent une partie de leur temps à la recherche scientifique et à la publication d'articles. Leur activité de consultants leur permet de s'inspirer des problèmes concrets rencontrés par nos clients.

Hippolyte Gisserot-Bouklef

Michael Voelske

Depuis mai 2022, je dirige l'équipe Data and Engineering chez Artefact , où je Postuler formation universitaire en informatique, notamment mon doctorat axé sur l'apprentissage automatique et la recherche d'informations, pour résoudre les problèmes commerciaux des clients Artefact. Mon rôle consiste non seulement à diriger, mais aussi à inspirer mon équipe afin de combiner la recherche de pointe en IA avec des applications pragmatiques. Passionné par la vulgarisation des concepts complexes de l'IA, je m'efforce de tirer parti de la technologie pour proposer des solutions commerciales innovantes et avoir un impact sociétal significatif.

Artefact

Domaine de recherche

Applications des grands modèles linguistiques à la recherche d'informations et au traitement du langage naturel

Modèles explicables en apprentissage automatique, recherche et classement

Recherche d'informations pour des besoins complexes et axés sur des tâches

Hippolyte Gisserot-Bouklef

Evan Hurwitz

Evan est titulaire d'un doctorat en ingénierie spécialisé en intelligence artificielle, dans le cadre duquel il a appliqué des techniques d'IA à l'optimisation d'un portefeuille géré activement à l'aide de multiples stratégies de trading. Il a mené des travaux de recherche dans le milieu universitaire, où il a coécrit l'ouvrage « Artificial Intelligence and Economic Theory: Skynet in the Market ». Il s'est ensuite orienté vers les solutions d'énergie verte utilisant l'apprentissage par renforcement pour S&P Platts, puis a travaillé avec Preqin sur l'intégration et l'analyse data relatives aux investissements alternatifs. Il a rejoint Artefact 2020 et a travaillé dans de nombreux secteurs tels que la distribution, la cybersécurité, le SaaS, l'ingénierie, l'éducation et l'immobilier, avec des clients allant des PME aux entreprises du FTSE 100.

Artefact

Domaines de recherche

Apprentissage par renforcement

Apprentissage automatique

Finance et jeux

Hippolyte Gisserot-Bouklef

George Cevora

George a obtenu son doctorat en neurosciences théoriques à l'université de Cambridge pour ses travaux sur la modélisation mathématique de l'apprentissage chez les animaux. George possède 10 ans d'expérience en recherche dans le domaine de l'apprentissage profond, qu'il met aujourd'hui en pratique dans le secteur industriel. Depuis qu'il a quitté le monde universitaire, George a travaillé dans un large éventail de secteurs et de domaines, allant des moteurs à réaction à la résistance aux antibiotiques. George a également passé plusieurs années dans le domaine de la sécurité nationale, où il a développé un produit visant à lutter contre la discrimination résultant d'une utilisation inappropriée de l'IA. Pour en savoir plus, rendez-vous sur www.cevora.xyz

Artefact

Domaines de recherche

Neurosciences

Apprentissage profond

Apprentissage automatique

Hippolyte Gisserot-Bouklef

Savio Rozario

Savio est titulaire d'un doctorat en physique expérimentale des plasmas laser de l'Imperial College de Londres, où il a utilisé des méthodes d'apprentissage automatique pour optimiser la configuration expérimentale de systèmes d'accélérateurs à plasma hautement non linéaires. Il a travaillé chez EY au sein du département R&D fiscal, où il a développé des solutions d'apprentissage automatique pour le contrôle de la conformité dans plusieurs zones géographiques à l'aide de grands modèles linguistiques. Il a rejoint Artefact 2022 et a fourni des solutions data de bout en bout dans divers secteurs, notamment la vente au détail, les transports et l'immobilier, pour des organisations du FTSE 250.

Artefact

Domaines de recherche

Apprentissage automatique

Optimisation non linéaire

Physique

Hippolyte Gisserot-Bouklef

Nelson Peace

Nelson a passé les dix premières années de sa carrière à travailler à la fois sur les marchés boursiers et les marchés des matières premières, où il a mis en œuvre des stratégies de trading quantitatives sur les marchés de gré à gré. Après avoir obtenu son master en Data en 2021, il a rejoint le bureau britannique Artefacten tant que data , où il travaille sur des problématiques data dans divers domaines, avec une expertise particulière dans les applications de l'IA sur les marchés financiers et dans le domaine du trading.

Artefact

Publications

Articles de blog sur Medium rédigés par nos experts techniques.

L'avenir de l'IA agentique reposera-t-il sur les graphes de connaissances ?

Alors que les entreprises s'empressent de mettre en œuvre l'IA, la plupart d'entre elles se rendent compte que leur data n'a jamais été conçue pour le raisonnement autonome. Aujourd'hui, jusqu'à 80 % des déploiements d'IA...

Enrichir l'expérience du bricolage : comment ADEO utilise l'IA pour relier contenu et savoir-faire

L'optimisation de l'assortiment est un processus essentiel dans le commerce de détail qui consiste à sélectionner la gamme idéale de produits pour répondre à la demande des consommateurs tout en tenant compte des nombreux aspects logistiques...

MotherDuck en détail : comment cette solution d'IA et d'analyse de nouvelle génération s'intègre à votre Data

MotherDuck étend les capacités analytiques de DuckDB au cloud des fonctionnalités collaboratives, offrant des performances quatre fois supérieures à celles de BigQuery et permettant de réaliser des économies par rapport data traditionnels grâce à...

Optimisation de la gamme de produits à l'aide de modèles de choix discret en Python

L'optimisation de l'assortiment est un processus essentiel dans le commerce de détail qui consiste à sélectionner la gamme idéale de produits pour répondre à la demande des consommateurs tout en tenant compte des nombreux aspects logistiques...

L'alignement des préférences est-il toujours la meilleure option pour améliorer la traduction basée sur les grands modèles de langage ? Une analyse empirique

Les indicateurs neuronaux utilisés pour évaluer la traduction automatique (TA) ont pris de plus en plus d'importance en raison de leur meilleure corrélation avec les jugements humains par rapport aux indicateurs lexicaux traditionnels

Choice-Learn : modélisation des choix à grande échelle pour les contextes opérationnels à travers le prisme de l'apprentissage automatique

Les modèles de choix discrets visent à prédire les choix effectués par des individus parmi un ensemble d'alternatives, appelé « assortiment ». Parmi les cas d'application bien connus, on peut citer la prédiction d'un...

L'ère de l'IA générative : ce qui change

La multitude et la diversité des réactions face à ChatGPT et aux autres IA génératives, qu'elles soient sceptiques ou enthousiastes, témoignent des changements qu'elles entraînent et de leur impact...

Comment Artefact à mettre au point un système de carrière à la fois équitable et simple pour les ingénieurs en informatique

Dans le secteur technologique actuel, dynamique et en constante évolution, un parcours professionnel peut souvent ressembler à un chemin sinueux au cœur d'une forêt dense d'opportunités. Avec l'évolution rapide...

Pourquoi avez-vous besoin de LLMOps ?

Cet article présente LLMOps, une discipline spécialisée qui combine DevOps et MLOps pour relever les défis posés par les grands modèles linguistiques (LLM)...

Exploiter tout le potentiel du langage d'expression LangChain (LCEL) : de la validation de principe à la mise en production

En moins d'un an, LangChain est devenue l'une des bibliothèques Python les plus utilisées pour interagir avec les modèles de langage de grande envergure (LLM), mais LangChain était avant tout une bibliothèque...

Comment nous avons procédé au rapprochement des identifiants de profil à l'aide de Treasure Data et de SQL

Dans cet article, nous expliquons les défis liés au rapprochement des identités et présentons notre approche pour créer un identifiant de profil unifié dans Data clients, plus précisément...

Snowday ’23 de Snowflake : un effet boule de neige vers la réussite Data

Alors que nous repensons aux idées échangées lors de l'événement « Snowday » des 1er et 2 novembre, une cascade de révélations passionnantes sur l'avenir de...