Artefact Centre de recherche
Combler le fossé entre le monde universitaire et les applications industrielles.
Recherche de modèles plus transparents et éthiques pour favoriser l'adoption de l'IA par les entreprises.
Exemples de biais de l'IA
- AppleCard accorde des prêts hypothécaires sur la base de critères racistes
- L'IA Lensa sexualise les selfies des femmes
- Classification des images racistes sur Facebook avec les afro-américains comme des singes
- Le chatbot Twitter de Microsoft devient nazi, sexiste et agressif
- ChatGPT qui écrit un code indiquant que les bons scientifiques sont des hommes blancs
Défi actuel
Les modèles d'IA sont précis et faciles à déployer dans de nombreux cas d'utilisation, mais restent incontrôlables en raison des boîtes noires et des questions éthiques.
La mission du Centre de recherche Artefact .
Un écosystème complet qui comble le fossé entre la recherche
la recherche fondamentale et les applications industrielles concrètes.
Emmanuel MALHERBE
Chef de la recherche
Domaine de recherche : Apprentissage profond, apprentissage automatique
En commençant par un doctorat sur les modèles NLP adaptés au recrutement en ligne, Emmanuel a toujours cherché un équilibre efficace entre la recherche pure et les applications à fort impact. Son expérience de recherche comprend la prévision de séries temporelles 5G pour Huawei Technologies et des modèles de vision par ordinateur pour les clients de la coiffure et du maquillage chez l'Oréal. Avant de rejoindre Artefact, il a travaillé à Shanghai en tant que responsable de la recherche en IA pour L'Oréal Asie. Aujourd'hui, son poste à Artefact est une opportunité et un environnement idéal pour combler le fossé entre le monde universitaire et l'industrie, et pour encourager sa recherche dans le monde réel tout en ayant un impact sur les applications industrielles.
Un écosystème complet qui comble le fossé entre la recherche fondamentale et les applications concrètes de l'industrie.
Domaines de recherche transversaux
Grâce à notre positionnement unique, nous visons à relever les défis généraux de l'IA, qu'il s'agisse de modélisation statistique ou de recherche en gestion.
Ces questions sont transversales à tous nos sujets et nourrissent notre recherche.
Thèmes
Nous travaillons sur plusieurs sujets de doctorat à l'intersection des cas d'utilisation industrielle et des limites de l'état de l'art.
Pour chaque sujet, nous travaillons en collaboration avec des professeurs d'université et avons accès au site industriel data qui nous permet d'aborder les principaux domaines de recherche dans un scénario réel donné.
1 - Prévisions et tarification
Modéliser les séries temporelles dans leur ensemble à l'aide d'un modèle de prévision contrôlable et multivariable. Cette modélisation nous permettra d'aborder la planification de la tarification et de la promotion en trouvant les paramètres optimaux qui augmentent les prévisions de ventes. Avec une telle approche holistique, nous visons à capturer la cannibalisation et la complémentarité entre les produits. Elle nous permettra de contrôler les prévisions en garantissant qu'elles restent cohérentes.
2 - Notation explicable et contrôlable
Une famille de modèles d'apprentissage automatique largement utilisée est basée sur les arbres de décision : forêts aléatoires, boosting. Bien que leur précision soit souvent à la pointe de la technologie, ces modèles souffrent d'un sentiment de boîte noire, donnant un contrôle limité à l'utilisateur. Nous visons à accroître leur explicabilité et leur transparence, notamment en améliorant l'estimation des valeurs SHAP dans le cas d'ensembles de données déséquilibrés. Nous visons également à fournir certaines garanties pour ces modèles, par exemple pour les échantillons non entraînés ou en permettant de meilleures contraintes monotones.
3 - Optimisation de l'assortiment
L'assortiment est un problème commercial majeur pour les détaillants qui se pose lors de la sélection de l'ensemble des produits à vendre dans les magasins. En utilisant de grands ensembles de données industrielles et des réseaux neuronaux, nous visons à construire des modèles plus robustes et interprétables qui rendent mieux compte du choix des clients lorsqu'ils sont confrontés à un assortiment de produits. La gestion de la cannibalisation et des complémentarités entre les produits, ainsi qu'une meilleure compréhension des groupes de clients, sont essentielles pour trouver un ensemble optimal de produits dans un magasin.
4 - L'adoption de l'IA dans les entreprises
Le défi d'une meilleure adoption de l'IA dans les entreprises est d'améliorer les modèles d'IA d'une part, et de comprendre les aspects humains et organisationnels d'autre part. Au croisement de la recherche qualitative en gestion et de la recherche sociale, cet axe cherche à explorer les difficultés rencontrées par les entreprises lors de l'adoption des outils d'IA. Les cadres existants sur l'adoption de l'innovation ne sont pas entièrement adaptés aux innovations en matière d'apprentissage automatique, car il existe des différences typiques avec la réglementation, la formation des personnes ou les préjugés lorsqu'il s'agit d'IA, et plus encore avec l'IA générative.
5 - Data- un développement durable axé sur la durabilité
Le projet mobilisera des méthodes de recherche qualitatives et quantitatives et abordera deux questions clés : Comment les entreprises peuvent-elles mesurer efficacement leur performance en matière de durabilité sociale et environnementale ? Pourquoi les mesures de durabilité ne parviennent-elles souvent pas à entraîner des changements significatifs dans les pratiques organisationnelles ?
D'une part, le projet vise à explorer les mesures basées sur le site data et à identifier les indicateurs permettant d'aligner les procédures organisationnelles sur les objectifs de durabilité sociale et environnementale. D'autre part, le projet se concentrera sur la transformation de ces mesures de durabilité en actions concrètes au sein des entreprises.
6 - Biais dans la vision par ordinateur
Lorsqu'un modèle fait une prédiction basée sur une image, par exemple celle d'un visage, il a accès à des informations sensibles, telles que l'origine ethnique, le sexe ou l'âge, qui peuvent fausser son raisonnement. Nous visons à développer un cadre permettant de mesurer mathématiquement ces biais et à proposer des méthodologies pour les réduire lors de l'apprentissage du modèle. En outre, notre approche permettrait de détecter statistiquement les zones de forte partialité afin d'expliquer, de comprendre et de contrôler les cas où de tels modèles renforcent la partialité présente sur le site data.
7 - LLM pour la recherche d'informations
L'une des principales applications des LLM est le couplage avec un corpus de documents qui représentent des connaissances ou des informations industrielles. Dans ce cas, il y a une étape de recherche d'information, pour laquelle les LLM montrent certaines limitations, telles que la taille du texte d'entrée, qui est trop petite pour l'indexation des documents. De même, l'effet d'hallucination peut également se produire dans la réponse finale, que nous visons à détecter en utilisant le document récupéré et l'incertitude du modèle au moment de l'inférence.
ArtefactLes chercheurs à temps partiel de la Commission européenne
Outre notre équipe dédiée à la recherche, nous avons plusieurs collaborateurs qui consacrent du temps à la recherche scientifique et à la publication d'articles. En travaillant également comme consultants, ils s'inspirent des problèmes concrets rencontrés par nos clients.
Publications
Articles de blog Medium rédigés par nos experts en technologie.
Choice-Learn: Large-scale choice modeling for operational contexts through the lens of machine learning
Discrete choice models aim at predicting choice decisions made by individuals from a menu of alternatives, called an assortment. Well-known use cases include predicting a...
L'ère de l'IA générative : ce qui change
L'abondance et la diversité des réponses à ChatGPT et aux autres IA génératives, qu'elles soient sceptiques ou enthousiastes, démontrent les changements qu'elles apportent et l'impact...
Comment Artefact a réussi à développer un système de carrière équitable et simple pour les ingénieurs logiciels
Dans le secteur technologique dynamique et en constante évolution d'aujourd'hui, une carrière peut souvent ressembler à un chemin sinueux à travers une forêt dense d'opportunités. Avec la rapidité...
Pourquoi vous avez besoin de LLMOps
Cet article présente LLMOps, une branche spécialisée fusionnant DevOps et MLOps pour gérer les défis posés par les grands modèles de langage (LLM)....
Libérer la puissance du LangChain Expression Language (LCEL) : de la preuve de concept à la production
LangChain est devenu en moins d'un an l'une des bibliothèques Python les plus utilisées pour interagir avec les LLM, mais LangChain était surtout une bibliothèque...
Comment nous avons géré la réconciliation des ID de profil en utilisant Treasure Data Unification et SQL
Dans cet article, nous expliquons les défis posés par la réconciliation des identifiants et démontrons notre approche pour créer un profil d'identifiant unifié dans la plateforme Customer Data , en particulier...