Article rédigé pour le blog Medium par les experts de Artefact en collaboration avec la communauté des entreprises de la French Tech.

L'abondance et la diversité des réponses à ChatGPT et à d'autres AI génératives, qu'elles soient sceptiques ou enthousiastes, démontrent les changements qu'elles apportent et l'impact qu'elles ont bien au-delà des cercles technologiques habituels. Le contraste est saisissant avec les générations précédentes de AI, qui étaient essentiellement prédictives et faisaient généralement l'objet d'articles ou de thèses confinés au domaine de la recherche et de l'innovation.

Pour les entreprises, les AI génératives sont également différentes des artificial intelligence précédentes. Si nous les comparons aux technologies les plus similaires, telles que le traitement du langage naturel (NLP) pour les corpus de textes ou la vision par ordinateur pour les data audiovisuelles, les AI génératives apportent quatre changements majeurs dont les entreprises prennent conscience au fur et à mesure qu'elles les expérimentent.

Tout d'abord, par rapport aux AI précédentes, les AI génératives accélèrent considérablement le déploiement des cas d'utilisation en ce sens qu'elles accélèrent la validation du concept. Deuxièmement, elles ouvrent un nouveau champ de possibilités, permettant un enrichissement plus facile, plus efficace et moins coûteux de la data non structurée. De plus, les résultats obtenus avec le AI génératif sont nouveaux en termes de qualité, de quantité et de diversité par rapport aux modèles utilisés précédemment. Tous ces facteurs font que nous devons répondre aux attentes accrues des utilisateurs finaux, alimentées par le battage médiatique autour de cette technologie. Nous développons ces quatre points ci-dessous.

Le AI génératif permet de tester plus rapidement la valeur ajoutée des cas d'utilisation.

Dans le domaine de la AI générative, le déploiement des cas d'utilisation est souvent plus rapide et moins laborieux qu'avec les AI précédentes. L'approche adoptée par le AI génératif est souvent comparée à l'assemblage de Legos, où des composants préexistants peuvent être combinés pour créer de nouveaux résultats. Cette facilité d'expérimentation et de mise en œuvre peut permettre de raccourcir les cycles de développement. En outre, un mode d'interaction conversationnel avec les utilisateurs accélère également l'adoption.

Un cas d'utilisation de data peut être réduit à un problème d'entreprise, data, un modèle et une invite. Traditionnellement, la création et l'optimisation du modèle représentent la partie la plus complexe et la plus longue du processus. Avec AI génératif, cette étape devient plus simple. Generative AI fournit des modèles pré-entraînés et prêts à l'emploi, ce qui permet aux entreprises de bénéficier d'une expertise avancée sans investir beaucoup de temps dans le développement et l'affinage des modèles. En pratique, les modèles (tels que GPT 4.0 d'Azure) sont accessibles “à la demande” ou peuvent être déployés via des API (telles que Gemini Pro BARD de Google). Certains fournisseurs proposent même des modèles spécialement adaptés à des domaines spécifiques, tels que la génération de textes juridiques, médicaux ou financiers.

Une fois le modèle déployé, il ne reste plus qu'à “ancrer” le modèle génératif AI, c'est-à-dire à ancrer les résultats générés par le modèle aux informations du monde réel de manière à contraindre le modèle à réagir dans un périmètre donné. Cela implique souvent l'ajout de contraintes ou d'informations supplémentaires pour guider le modèle vers la production de résultats cohérents et pertinents dans un contexte spécifique. Cependant, on est loin du temps nécessaire à l'entraînement des modèles AI que nous avons utilisés jusqu'à présent.

Prenons l'exemple d'un cas d'utilisation pour l'analyse des verbatims d'un centre d'appel pour illustrer notre propos. Selon une étude de Artefact, pour développer ce type de cas d'utilisation à l'aide de modèles basés sur des AI antérieures, il fallait généralement trois à quatre semaines à partir du moment où la data était récupérée et rendue utilisable. Aujourd'hui, grâce au AI génératif, ce processus ne prend plus qu'une semaine, soit un facteur d'accélération de plus de trois. Le principal défi consiste à choisir la classification commerciale appropriée pour adapter le modèle.

Le AI génératif étend le champ d'application du AI à des data peu ou mal utilisés auparavant.

Certains gisements de pétrole ne sont rentables que lorsque les prix du pétrole montent en flèche. Le même principe peut être appliqué à data. Certaines data non structurées peuvent désormais être exploitées grâce aux AI génératives, ce qui ouvre un tout nouveau champ de data exploitables pour l'entraînement ou la mise au point de modèles, et offre de nombreuses perspectives pour des applications spécialisées dans des domaines spécifiques.

Une promesse émerge : celle de AI génératives capables de traiter et de combiner n'importe quel type de data dans leurs processus de formation, en évitant le travail long et fastidieux de structuration et d'amélioration de la qualité de la data de l'entreprise pour la rendre utilisable. Une promesse qui n'a pas encore été tenue, d'après les observations actuelles.

Generative AI n'a pas seulement bénéficié d'une véritable percée dans les mécanismes de l'attention. Il a également bénéficié de la puissance toujours croissante - et nécessaire - des machines.

Les mécanismes d'attention fonctionnent un peu comme la capacité d'une personne à se concentrer sur une partie importante d'une image ou d'un texte lorsqu'elle essaie de comprendre ou de créer quelque chose. Imaginez que vous essayez de dessiner un paysage à partir d'une photographie. Plutôt que de regarder toute l'image en même temps, vous vous concentrez sur certaines parties qui semblent importantes, comme les montagnes ou les arbres. Cela vous permet de mieux comprendre les détails importants et de créer un dessin plus précis. De même, les mécanismes d'attention permettent au modèle de se concentrer sur des parties spécifiques d'une image ou d'un texte lorsqu'il génère du contenu. Au lieu de traiter toutes les données en même temps, le modèle peut se concentrer sur les parties les plus pertinentes et les plus importantes pour produire des résultats plus précis et plus significatifs. Il peut ainsi apprendre à créer des images, du texte ou d'autres types de contenu de manière plus efficace et plus réaliste.

Les mécanismes d'attention se parallélisent très bien. L'utilisation de plusieurs mécanismes d'attention fournit une représentation plus riche et plus robuste de data, ce qui permet d'améliorer les performances dans diverses tâches telles que la traduction automatique, la génération de texte, la synthèse vocale, la génération d'images et bien d'autres.

Ainsi, des cas d'utilisation qui semblaient impossibles il y a peu sont devenus tout à fait accessibles. C'est le cas, par exemple, du calcul du temps de parole dans les médias lors des campagnes présidentielles. Il y a encore deux ans, calculer précisément le temps de parole de chaque candidat était une opération fastidieuse. Aujourd'hui, grâce à l'utilisation de AI générative, c'est possible.

En ce qui concerne les capacités de calcul, OpenAI a publié il y a six ans une analyse montrant que depuis 2012, la quantité de calcul utilisée dans les sessions de formation les plus importantes de AI a augmenté de manière exponentielle, avec un temps de doublement de 3,4 mois (à titre de comparaison, la loi de Moore avait une période de doublement de deux ans). Depuis 2012, cette mesure a été multipliée par plus de 300 000 (une période de doublement de deux ans ne produirait qu'une multiplication par sept).

Les modèles génératifs AI nécessitent souvent d'énormes quantités de puissance de calcul pour la formation, d'autant plus que les modèles sont conçus pour être généralistes et qu'ils ont besoin de grandes quantités de contenu pour la formation. Des ressources informatiques puissantes, telles que des GPU ou TPU haut de gamme, sont nécessaires pour traiter de grands ensembles data et exécuter des algorithmes d'optimisation complexes. Le nouveau GPU NVIDIA A100 Tensor Core semble fournir une accélération sans précédent. Selon Nvidia, l'A100 offre des performances jusqu'à 20 fois supérieures à la génération précédente et peut être partitionné en sept instances de GPU pour s'adapter dynamiquement à l'évolution des demandes. Il serait également doté de la bande passante mémoire la plus rapide au monde, avec plus de deux téraoctets par seconde (TB/s) pour l'exécution des plus grands modèles et des datasets.

Il convient de noter que les progrès de l'informatique ont été un élément clé de la progression de artificial intelligence. Tant que cette tendance se poursuit, nous devons nous préparer aux implications de systèmes qui dépassent de loin les capacités actuelles et qui repousseront encore les limites, tout en mettant en balance la valeur apportée par ces systèmes et les coûts qu'ils engendrent, notamment en termes d'énergie et d'environnement. Nous aborderons ces points dans un prochain article.

Generative AI améliore la diversité, la qualité et la quantité des résultats obtenus

La AI générative se distingue clairement de la AI précédente par son impact sur les résultats générés par ses modèles. Non seulement la quantité de résultats générés a augmenté, mais aussi leur qualité et leur diversité. Cependant, tous ces aspects positifs doivent être tempérés par une reproductibilité plus faible des modèles AI génératifs.

Si l'on considère l'image d'un puzzle, l'analyse de data peut être comparée à son assemblage, où chaque pièce de data représente une pièce à arranger afin de révéler une image cohérente. La AI joue un rôle essentiel en essayant de combler les lacunes de la data en utilisant les informations disponibles pour déduire et recréer les pièces manquantes. Le AI génératif va au-delà du simple fait de compléter le data existant en créant un nouveau data inspiré de ce qui existe déjà. Ce processus élargit les capacités d'analyse et permet de découvrir de nouvelles informations à partir de data existantes, ce qui met l'aspect génératif au premier plan.

Contrairement aux générations précédentes de AI, qui ont tendance à produire des résultats souvent similaires, les modèles génératifs de AI sont capables de générer une plus grande diversité de résultats en explorant différentes variations et alternatives. Cette diversité accrue permet de générer un contenu plus riche et plus diversifié, passant du quantitatif au qualitatif et couvrant un éventail plus large de besoins et de préférences.

OpenAI était récemment à Hollywood pour présenter son dernier modèle appelé “Sora”, capable de générer des vidéos à partir de texte. “Entendre qu'il peut faire toutes ces choses est une chose, mais en voir les capacités est stupéfiant”, a déclaré le producteur hollywoodien Mike Perry, soulignant la diversité et la qualité des capacités offertes par le AI génératif.

Toutefois, en raison de leur capacité à explorer un espace plus large de possibilités, les modèles génératifs AI peuvent être moins reproductibles que les précédents, et la précision des résultats est compromise. Concrètement, il est plus difficile de reproduire exactement les mêmes résultats à chaque fois que le modèle est exécuté, ce qui peut poser des problèmes en termes de fiabilité et de prévisibilité dans certaines applications critiques.

Cette limitation constitue un défi majeur pour les applications de AI générative qui nécessitent des réponses précises. C'est un domaine sur lequel les entreprises travaillent dans leurs développements actuels : mieux spécialiser les modèles dans des domaines très spécifiques pour améliorer la précision des réponses, et combiner la robustesse des modèles basés sur des règles ou des requêtes sur data structuré avec la facilité d'utilisation et d'interaction avec les utilisateurs de AI génératif en connectant ces derniers aux sorties des premiers.

Attentes accrues des utilisateurs finaux

Lorsqu'il s'agit de gérer les attentes et la relation des utilisateurs finaux avec la technologie, la technologie générative AI présente plusieurs défis spécifiques. En raison de sa capacité à produire des résultats rapidement, le AI génératif peut susciter des attentes particulièrement élevées. À l'inverse, l'apparition d'hallucinations et de résultats indésirables peut fortement ébranler la confiance des utilisateurs dans ces solutions.

Generative AI est capable de produire des résultats rapidement et de manière automatisée, ce qui peut donner aux utilisateurs finaux l'impression que la technologie est capable de résoudre tous leurs problèmes instantanément et efficacement. Cela peut conduire à des attentes disproportionnées quant aux capacités réelles de la AI générative, et à la déception si les résultats ne répondent pas entièrement à ces attentes élevées.

La technologie générative AI n'est évidemment pas parfaite et peut parfois produire des résultats inattendus ou indésirables, tels qu'un contenu incohérent, faux ou inapproprié. L'apparition de tels résultats indésirables peut entraîner une perte de confiance de l'utilisateur final dans la technologie, remettant en question sa fiabilité et son utilité. Ils peuvent également susciter des inquiétudes en matière de sécurité et de respect de la vie privée lorsque des résultats inattendus compromettent l'intégrité des informations générées par la AI générative.

En février 2023, le chatbot Bard de Google (rebaptisé Gemini) a fourni des informations erronées lorsqu'on lui a posé des questions sur les découvertes du télescope spatial James Webb de la NASA. Il a affirmé à tort que le télescope avait pris les premières photos d'une exoplanète. Cette affirmation est erronée, car les premières photos d'une exoplanète datent de 2004, alors que le télescope James Webb n'a été lancé qu'en 2021 (source : équipe CNET France, 2024).

Il est donc essentiel que les utilisateurs finaux des systèmes génératifs AI soient conscients de leurs limites. C'est pourquoi la plupart des entreprises qui déploient ces solutions s'efforcent d'accompagner les utilisateurs dans leur utilisation : formation à l'art de l'incitation, explication des limites de ces systèmes, clarification des attentes qui peuvent ou ne peuvent pas être satisfaites, et rappel des règles applicables en termes de protection des data.

Plus d'un an après la sortie de ChatGPT, les attentes à l'égard de cette nouvelle technologie sont plus élevées que jamais. Cependant, la valeur associée à cette technologie doit encore se matérialiser dans des cas d'utilisation tangibles. Dans notre prochain article, nous aborderons les sujets liés à l'adoption de la technologie par les entreprises et à sa diffusion au sein de l'organisation.

Sous la direction de :

  • Guillaume Lame - Directeur général Data - Natixis

  • Antoine Le Feuvre - VP Digital Solutions - Suez

Moyen Blog par Artefact.

Cet article a été initialement publié sur Medium.com.
Suivez-nous sur notre Medium Blog !