Artefact Research Center
Faire le lien entre le monde universitaire et les applications industrielles.

Recherche sur des modèles plus transparents et plus éthiques visant à favoriser l'adoption de l'IA par les entreprises.

Exemples de biais dans l'IA
- AppleCard accorde des prêts immobiliers sur la base de critères racistes
- Lensa AI sexualise les selfies des femmes
- Classification raciste d'images sur Facebook représentant des Afro-Américains sous les traits de singes
- Le chatbot Twitter de Microsoft devient nazi, sexiste et agressif
- ChatGPT qui écrit un code affirmant que les bons scientifiques sont des hommes blancs
Défi actuel
Les modèles d'IA sont précis et faciles à mettre en œuvre dans de nombreux cas d'utilisation, mais restent incontrôlables en raison du caractère opaque de leur fonctionnement et des questions éthiques qu'ils soulèvent.
La missionResearch Center Artefact .
Un écosystème complet qui comble le fossé entre la recherche fondamentale en
et les applications industrielles concrètes.


Emmanuel MALHERBE
Responsable de la recherche
Domaine de recherche : apprentissage profond, apprentissage automatique
Après avoir obtenu un doctorat sur les modèles de TALN adaptés au recrutement en ligne, Emmanuel a toujours cherché à trouver un juste équilibre entre la recherche fondamentale et les applications concrètes. Son expérience en recherche comprend notamment des prévisions de séries chronologiques en 5G pour Huawei Technologies et des modèles de vision par ordinateur destinés aux clients des salons de coiffure et de maquillage chez L’Oréal. Avant de rejoindre Artefact, il a occupé à Shanghai le poste de responsable de la recherche en IA pour L’Oréal Asie. Aujourd’hui, son poste chez Artefact une opportunité parfaite et un environnement idéal pour faire le lien entre le monde universitaire et l’industrie, et pour développer ses recherches ancrées dans la réalité tout en ayant un impact sur les applications industrielles.
Lisez notre dernière éditionResearch Center Artefact
Domaines de recherche transversaux
Grâce à notre positionnement unique, nous nous attachons à relever les défis généraux liés à l'IA, qu'il s'agisse de modélisation statistique ou de recherche en gestion.
Ces questions sont transversales à toutes nos disciplines et nourrissent nos travaux de recherche.
Un écosystème complet qui fait le lien entre la recherche fondamentale et les applications concrètes dans l'industrie.

Matières
Nous travaillons sur plusieurs sujets de thèse à la croisée des cas d'utilisation industriels et des limites actuelles de la technologie.
Pour chaque sujet, nous collaborons avec des professeurs d'université et avons accès à data industrielles data nous permettent d'aborder les principaux axes de recherche dans un scénario concret donné.
1 — Prévisions et tarification
Modéliser les séries chronologiques dans leur ensemble à l'aide d'un modèle de prévision multivarié et contrôlable. Cette modélisation nous permettra d'aborder la tarification et la planification des promotions en déterminant les paramètres optimaux qui augmentent les prévisions de ventes. Grâce à cette approche globale, nous visons à prendre en compte la cannibalisation et la complémentarité entre les produits. Cela nous permettra de contrôler les prévisions tout en garantissant la cohérence des prévisions.
2 — Un système de notation explicable et contrôlable
Une famille très répandue de modèles d'apprentissage automatique repose sur les arbres de décision : les forêts aléatoires et le boosting. Bien que leur précision soit souvent à la pointe de la technologie, ces modèles souffrent d'un manque de transparence, ce qui limite le contrôle dont dispose l'utilisateur. Notre objectif est d'améliorer leur explicabilité et leur transparence, généralement en affinant l'estimation des valeurs SHAP dans le cas d'ensembles de données déséquilibrés. Nous visons également à fournir certaines garanties pour ces modèles, par exemple pour les échantillons hors entraînement ou en permettant de meilleures contraintes monotones.
3 — Optimisation de l'assortiment
La composition de l'assortiment constitue un enjeu commercial majeur pour les détaillants, qui se pose lors du choix de l'ensemble des produits à vendre en magasin. À l'aide de vastes ensembles de données industrielles et de réseaux neuronaux, nous cherchons à développer des modèles plus robustes et plus interprétables, capables de mieux refléter les choix des clients face à un assortiment de produits. La prise en compte de la cannibalisation et des complémentarités entre les produits, ainsi qu'une meilleure compréhension des segments de clientèle, sont essentielles pour déterminer l'assortiment de produits le plus optimal pour un magasin.
4 — L'adoption de l'IA dans les entreprises
Le défi d'une meilleure adoption de l'IA dans les entreprises consiste, d'une part, à améliorer les modèles d'IA et, d'autre part, à comprendre les aspects humains et organisationnels. À la croisée de la recherche qualitative en gestion et de la recherche sociale, cet axe vise à explorer les difficultés rencontrées par les entreprises lors de l'adoption d'outils d'IA. Les cadres théoriques existants sur l'adoption de l'innovation ne sont pas entièrement adaptés aux innovations en matière d'apprentissage automatique, car il existe des différences caractéristiques en matière de réglementation, de formation du personnel ou de biais lorsqu'il s'agit d'IA, et ce d'autant plus avec l'IA générative.
5 — Développement durable Data
Ce projet fera appel à des méthodes de recherche qualitatives et quantitatives et s'attachera à répondre à deux questions fondamentales : comment les entreprises peuvent-elles mesurer efficacement leurs performances en matière de durabilité sociale et environnementale ? Pourquoi les mesures de durabilité ne parviennent-elles souvent pas à induire des changements significatifs dans les pratiques organisationnelles ?
D'une part, le projet vise à étudier des indicateurs data et à identifier des repères permettant d'aligner les procédures organisationnelles sur les objectifs de durabilité sociale et environnementale. D'autre part, le projet s'attachera à traduire ces mesures de durabilité en actions concrètes au sein des entreprises.
6 — Les biais dans la vision par ordinateur
Lorsqu'un modèle émet une prédiction à partir d'une image, par exemple celle d'un visage, il a accès à des informations sensibles, telles que l'origine ethnique, le sexe ou l'âge, qui peuvent biaiser son raisonnement. Notre objectif est de développer un cadre permettant de mesurer mathématiquement ce biais, et de proposer des méthodologies pour le réduire pendant l'entraînement du modèle. De plus, notre approche permettrait de détecter statistiquement les zones de fort biais afin d'expliquer, de comprendre et de contrôler les endroits où ces modèles renforcent le biais présent dans les data.
7 — LLM pour la recherche d'informations
L'une des principales applications des modèles de langage à grande échelle (LLM) consiste à les associer à un corpus de documents contenant des connaissances ou des informations sectorielles. Dans ce cas, une étape de recherche d'informations est nécessaire, pour laquelle les LLM présentent certaines limites, telles que la taille du texte d'entrée, qui est trop réduite pour permettre l'indexation des documents. De même, un effet d'hallucination peut également se produire dans la réponse finale, que nous cherchons à détecter en nous appuyant sur le document récupéré et sur l'incertitude du modèle au moment de l'inférence.
Les chercheurs à temps partiel Artefact
Outre notre équipe dédiée à la recherche, nous comptons plusieurs collaborateurs qui consacrent une partie de leur temps à la recherche scientifique et à la publication d'articles. Leur activité de consultants leur permet de s'inspirer des problèmes concrets rencontrés par nos clients.
Publications
Articles de blog sur Medium rédigés par nos experts techniques.
L'avenir de l'IA agentique reposera-t-il sur les graphes de connaissances ?
Alors que les entreprises s'empressent de mettre en œuvre l'IA, la plupart d'entre elles se rendent compte que leur data n'a jamais été conçue pour le raisonnement autonome. Aujourd'hui, jusqu'à 80 % des déploiements d'IA...
Enrichir l'expérience du bricolage : comment ADEO utilise l'IA pour relier contenu et savoir-faire
L'optimisation de l'assortiment est un processus essentiel dans le commerce de détail qui consiste à sélectionner la gamme idéale de produits pour répondre à la demande des consommateurs tout en tenant compte des nombreux aspects logistiques...
MotherDuck en détail : comment cette solution d'IA et d'analyse de nouvelle génération s'intègre à votre Data
MotherDuck étend les capacités analytiques de DuckDB au cloud des fonctionnalités collaboratives, offrant des performances quatre fois supérieures à celles de BigQuery et permettant de réaliser des économies par rapport data traditionnels grâce à...
Optimisation de la gamme de produits à l'aide de modèles de choix discret en Python
L'optimisation de l'assortiment est un processus essentiel dans le commerce de détail qui consiste à sélectionner la gamme idéale de produits pour répondre à la demande des consommateurs tout en tenant compte des nombreux aspects logistiques...
L'alignement des préférences est-il toujours la meilleure option pour améliorer la traduction basée sur les grands modèles de langage ? Une analyse empirique
Les indicateurs neuronaux utilisés pour évaluer la traduction automatique (TA) ont pris de plus en plus d'importance en raison de leur meilleure corrélation avec les jugements humains par rapport aux indicateurs lexicaux traditionnels
Choice-Learn : modélisation des choix à grande échelle pour les contextes opérationnels à travers le prisme de l'apprentissage automatique
Les modèles de choix discrets visent à prédire les choix effectués par des individus parmi un ensemble d'alternatives, appelé « assortiment ». Parmi les cas d'application bien connus, on peut citer la prédiction d'un...
L'ère de l'IA générative : ce qui change
La multitude et la diversité des réactions face à ChatGPT et aux autres IA génératives, qu'elles soient sceptiques ou enthousiastes, témoignent des changements qu'elles entraînent et de leur impact...
Comment Artefact à mettre au point un système de carrière à la fois équitable et simple pour les ingénieurs en informatique
Dans le secteur technologique actuel, dynamique et en constante évolution, un parcours professionnel peut souvent ressembler à un chemin sinueux au cœur d'une forêt dense d'opportunités. Avec l'évolution rapide...
Pourquoi avez-vous besoin de LLMOps ?
Cet article présente LLMOps, une discipline spécialisée qui combine DevOps et MLOps pour relever les défis posés par les grands modèles linguistiques (LLM)...
Exploiter tout le potentiel du langage d'expression LangChain (LCEL) : de la validation de principe à la mise en production
En moins d'un an, LangChain est devenue l'une des bibliothèques Python les plus utilisées pour interagir avec les modèles de langage de grande envergure (LLM), mais LangChain était avant tout une bibliothèque...
Comment nous avons procédé au rapprochement des identifiants de profil à l'aide de Treasure Data et de SQL
Dans cet article, nous expliquons les défis liés au rapprochement des identités et présentons notre approche pour créer un identifiant de profil unifié dans Data clients, plus précisément...
Snowday ’23 de Snowflake : un effet boule de neige vers la réussite Data
Alors que nous repensons aux idées échangées lors de l'événement « Snowday » des 1er et 2 novembre, une cascade de révélations passionnantes sur l'avenir de...




















































