Article rédigé pour le blog Medium par les experts de Artefact en collaboration avec la communauté des entreprises de la French Tech.

L'abondance et la diversité des réactions à ChatGPT et aux autres IA génératives, qu'elles soient sceptiques ou enthousiastes, démontrent les changements qu'elles apportent et l'impact qu'elles ont bien au-delà des cercles technologiques habituels. Le contraste est saisissant avec les générations précédentes d'IA, qui étaient essentiellement prédictives et faisaient généralement l'objet d'articles ou de thèses confinés au domaine de la recherche et de l'innovation.

Pour les entreprises, l'IA générative est également différente des intelligences artificielles précédentes. Si nous les comparons aux technologies les plus similaires, telles que le traitement du langage naturel (NLP) pour les corpus de textes ou la vision par ordinateur pour l'audiovisuel data, les IA génératives apportent quatre changements majeurs dont les entreprises prennent conscience au fur et à mesure qu'elles les expérimentent.

Premièrement, par rapport à l'IA précédente, l'IA générative accélère considérablement le déploiement des cas d'utilisation en ce sens qu'elle accélère la validation du concept. Deuxièmement, elle ouvre un nouveau champ de possibilités, permettant un enrichissement plus facile, plus efficace et moins coûteux de l'information non structurée data. De plus, les résultats obtenus avec l'IA générative sont nouveaux en termes de qualité, de quantité et de diversité par rapport aux modèles utilisés précédemment. Tous ces éléments nous amènent à devoir répondre aux attentes accrues des utilisateurs finaux, alimentées par le battage médiatique autour de cette technologie. Nous développons ces quatre points ci-dessous.

L'IA générative permet de tester plus rapidement la valeur ajoutée des cas d'utilisation

Dans le domaine de l'IA générative, le déploiement des cas d'utilisation est souvent plus rapide et moins laborieux qu'avec les IA précédentes. L'approche adoptée par l'IA générative est souvent comparée à l'assemblage de Legos, où des composants préexistants peuvent être combinés pour créer de nouveaux résultats. Cette facilité d'expérimentation et de mise en œuvre peut permettre de raccourcir les cycles de développement. En outre, un mode d'interaction conversationnel avec les utilisateurs accélère également l'adoption.

Un cas d'utilisation data peut être réduit à un problème commercial, data, un modèle et une invite. Traditionnellement, la création et l'optimisation du modèle représentent la partie la plus complexe et la plus longue du processus. Avec l'IA générative, cette étape devient plus simple. L'IA générative fournit des modèles pré-entraînés et prêts à l'emploi, ce qui permet aux entreprises de bénéficier d'une expertise avancée sans investir beaucoup de temps dans le développement et l'affinage des modèles. En pratique, les modèles (tels que GPT 4.0 d'Azure) sont accessibles "à la demande" ou peuvent être déployés via des API (telles que Gemini Pro BARD de Google). Certains fournisseurs proposent même des modèles spécialement adaptés à des domaines spécifiques, tels que la génération de textes juridiques, médicaux ou financiers.

Une fois le modèle déployé, il ne reste plus qu'à "ancrer" le modèle génératif d'IA, c'est-à-dire à ancrer les résultats générés par le modèle aux informations du monde réel de manière à contraindre le modèle à réagir dans un périmètre donné. Cela implique souvent l'ajout de contraintes ou d'informations supplémentaires pour guider le modèle vers la production de résultats cohérents et pertinents dans un contexte spécifique. Mais on est loin du temps nécessaire à l'entraînement des modèles d'IA que nous avons utilisés jusqu'à présent.

Prenons l'exemple d'un cas d'utilisation d'analyse de verbatim d'un centre d'appel pour illustrer notre propos. Selon une étude de Artefact , pour développer ce type de cas d'utilisation à l'aide de modèles basés sur l'IA antérieure, il fallait généralement trois à quatre semaines à partir du moment où le site data était récupéré et rendu utilisable. Aujourd'hui, grâce à l'IA générative, ce processus ne prend plus qu'une semaine, soit un facteur d'accélération de plus de trois. Le principal défi consiste à choisir la classification commerciale appropriée pour adapter le modèle.

L'IA générative étend le champ d'application de l'IA à des domaines jusqu'ici peu ou mal utilisés. data

Certains gisements de pétrole ne sont rentables que lorsque les prix du pétrole montent en flèche. Le même principe peut être appliqué à data. Certains data non structurés peuvent désormais être exploités grâce à l'IA générative, ce qui ouvre un tout nouveau champ de data exploitables pour l'entraînement ou la mise au point de modèles, et offre de nombreuses perspectives pour des applications spécialisées dans des domaines spécifiques.

Et une promesse émerge : celle d'IA génératives capables de traiter et de combiner n'importe quel type de data dans leurs processus de formation, en contournant le travail long et fastidieux de structuration et d'amélioration de la qualité de l'entreprise data pour la rendre utilisable. Une promesse qui n'a pas encore été tenue, d'après les observations actuelles.

L'IA générative n'a pas seulement bénéficié d'une véritable percée dans les mécanismes d'attention. Elle a également bénéficié de la puissance toujours croissante - et nécessaire - des machines.

Les mécanismes d'attention fonctionnent un peu comme la capacité d'une personne à se concentrer sur une partie importante d'une image ou d'un texte lorsqu'elle essaie de comprendre ou de créer quelque chose. Imaginez que vous essayez de dessiner un paysage à partir d'une photographie. Au lieu de regarder toute l'image en même temps, vous vous concentrez sur certaines parties qui semblent importantes, comme les montagnes ou les arbres. Cela vous permet de mieux comprendre les détails importants et de créer un dessin plus précis. De même, les mécanismes d'attention permettent au modèle de se concentrer sur des parties spécifiques d'une image ou d'un texte lorsqu'il génère du contenu. Au lieu de traiter toutes les données en même temps, le modèle peut se concentrer sur les parties les plus pertinentes et les plus importantes pour produire des résultats plus précis et plus significatifs. Il peut ainsi apprendre à créer des images, du texte ou d'autres types de contenu de manière plus efficace et plus réaliste.

Les mécanismes d'attention se parallélisent très bien. L'utilisation de plusieurs mécanismes d'attention fournit une représentation plus riche et plus robuste de data, ce qui permet d'améliorer les performances dans diverses tâches telles que la traduction automatique, la génération de texte, la synthèse vocale, la génération d'images et bien d'autres.

Ainsi, des cas d'utilisation qui semblaient impossibles il y a peu sont devenus tout à fait accessibles. C'est le cas, par exemple, du calcul du temps de parole dans les médias lors des campagnes présidentielles. Il y a encore deux ans, calculer précisément le temps de parole de chaque candidat était une opération fastidieuse. Aujourd'hui, grâce à l'utilisation de l'IA générative, c'est possible.

En ce qui concerne les capacités de calcul, il y a six ans, l'OpenAI a publié une analyse montrant que depuis 2012, la quantité de calcul utilisée dans les sessions d'entraînement à l'IA les plus importantes a augmenté de manière exponentielle, avec un temps de doublement de 3,4 mois (à titre de comparaison, la loi de Moore avait une période de doublement de deux ans). Depuis 2012, cette mesure a été multipliée par plus de 300 000 (une période de doublement de deux ans ne produirait qu'une multiplication par sept).

Les modèles d'IA générative nécessitent souvent d'énormes quantités de puissance de calcul pour l'apprentissage, d'autant plus que les modèles sont conçus pour être généralistes et qu'ils ont besoin de grandes quantités de contenu pour l'apprentissage. Des ressources informatiques puissantes, telles que des GPU ou TPU haut de gamme, sont nécessaires pour traiter de grands ensembles de données et exécuter des algorithmes d'optimisation complexes. Le nouveau GPU NVIDIA A100 Tensor Core semble fournir une accélération sans précédent. Selon Nvidia, l'A100 offre des performances jusqu'à 20 fois supérieures à la génération précédente et peut être partitionné en sept instances de GPU pour s'adapter dynamiquement à l'évolution des demandes. Il serait également doté de la bande passante mémoire la plus rapide au monde, avec plus de deux téraoctets par seconde (TB/s) pour l'exécution des modèles et des ensembles de données les plus volumineux.

Il convient de noter que les progrès de l'informatique ont été un élément clé de l'évolution de l'intelligence artificielle. Tant que cette tendance se poursuivra, nous devrons nous préparer aux implications de systèmes qui dépassent de loin les capacités actuelles et qui repousseront encore les limites, tout en mettant en balance la valeur apportée par ces systèmes et les coûts qu'ils engendrent, notamment en termes d'énergie et d'environnement. Nous aborderons ces points dans un prochain article.

L'IA générative améliore la diversité, la qualité et la quantité des résultats obtenus

L'IA générative se distingue clairement de l'IA précédente par son impact sur les résultats générés par ses modèles. Non seulement la quantité de résultats générés a augmenté, mais aussi leur qualité et leur diversité. Cependant, tous ces aspects positifs doivent être tempérés par une reproductibilité plus faible des modèles d'IA générative.

Si l'on considère l'image d'un puzzle, l'analyse de data peut être comparée à son assemblage, où chaque pièce de data représente une pièce à arranger pour révéler une image cohérente. L'IA joue un rôle essentiel en essayant de combler les lacunes de data en utilisant les informations disponibles pour déduire et recréer les pièces manquantes. L'IA générative ne se contente pas de compléter les sites data existants, elle crée de nouveaux sites data en s'inspirant de ce qui existe déjà. Ce processus élargit les capacités d'analyse et permet de découvrir de nouvelles informations à partir de data, ce qui met l'aspect génératif au premier plan.

class="img-responsive

Contrairement aux générations précédentes d'IA, qui tendent à produire des résultats souvent similaires, les modèles d'IA générative sont capables de générer une plus grande diversité de résultats en explorant différentes variations et alternatives. Cette diversité accrue permet de générer un contenu plus riche et plus diversifié, passant du quantitatif au qualitatif et couvrant un éventail plus large de besoins et de préférences.

OpenAI était récemment à Hollywood pour présenter son dernier modèle appelé "Sora", capable de générer des vidéos à partir d'un texte. "Entendre qu'il peut faire toutes ces choses est une chose, mais en voir les capacités est stupéfiant", a déclaré Mike Perry, producteur à Hollywood, soulignant la diversité et la qualité des capacités offertes par l'IA générative.

Cependant, en raison de leur capacité à explorer un espace de possibilités plus large, les modèles d'IA générative peuvent être moins reproductibles que les IA précédentes, et la précision des résultats est compromise. Concrètement, il est plus difficile de reproduire exactement les mêmes résultats à chaque fois que le modèle est exécuté, ce qui peut poser des problèmes en termes de fiabilité et de prévisibilité dans certaines applications critiques.

Cette limitation constitue un défi majeur pour les applications de l'IA générative qui nécessitent des réponses précises. C'est un domaine sur lequel les entreprises travaillent dans leurs développements actuels : mieux spécialiser les modèles dans des domaines très spécifiques pour améliorer la précision des réponses, et combiner la robustesse des modèles basés sur des règles ou des requêtes sur data structuré avec la facilité d'utilisation et d'interaction avec les utilisateurs de l'IA générative en connectant ces derniers aux sorties des premiers.

Attentes accrues des utilisateurs finaux

Lorsqu'il s'agit de gérer les attentes et la relation des utilisateurs finaux avec la technologie, l'IA générative présente plusieurs défis spécifiques. En raison de sa capacité à produire des résultats rapidement, l'IA générative peut susciter des attentes particulièrement élevées. À l'inverse, l'apparition d'hallucinations et de résultats indésirables peut fortement ébranler la confiance des utilisateurs dans ces solutions.

L'IA générative est capable de produire des résultats rapidement et de manière automatisée, ce qui peut donner aux utilisateurs finaux l'impression que la technologie est capable de résoudre tous leurs problèmes instantanément et efficacement. Cela peut conduire à des attentes disproportionnées quant aux capacités réelles de l'IA générative, et à la déception si les résultats ne répondent pas pleinement à ces attentes élevées.

L'IA générative n'est évidemment pas parfaite et peut parfois produire des résultats inattendus ou indésirables, tels que des contenus incohérents, faux ou inappropriés. L'apparition de tels résultats indésirables peut entraîner une perte de confiance de l'utilisateur final dans la technologie, remettant en question sa fiabilité et son utilité. Elle peut également susciter des inquiétudes concernant la sécurité et la vie privée sur le site data lorsque des résultats inattendus compromettent l'intégrité des informations générées par l'IA générative.

En février 2023, le chatbot Bard de Google (rebaptisé Gemini) a fourni des informations erronées lorsqu'on lui a posé des questions sur les découvertes du télescope spatial James Webb de la NASA. Il a affirmé à tort que le télescope avait pris les premières photos d'une exoplanète. Cette affirmation est erronée, car les premières photos d'une exoplanète datent de 2004, alors que le télescope James Webb n'a été lancé qu'en 2021 (source : équipe CNET France, 2024).

Il est donc essentiel que les utilisateurs finaux des systèmes d'IA générative soient conscients de leurs limites. C'est pourquoi la plupart des entreprises qui déploient ces solutions s'efforcent d'accompagner les utilisateurs dans leur utilisation : formation à l'art de l'incitation, explication des limites de ces systèmes, clarification des attentes qui peuvent ou ne peuvent pas être satisfaites, et rappel des règles applicables en termes de protection du site data .

Plus d'un an après la sortie de ChatGPT, les attentes à l'égard de cette nouvelle technologie sont plus élevées que jamais. Cependant, la valeur associée à cette technologie doit encore se matérialiser dans des cas d'utilisation tangibles. Dans notre prochain article, nous aborderons les sujets liés à l'adoption de la technologie par les entreprises et à sa diffusion au sein de l'organisation.

Sous la direction de :

  • Guillaume Lame - Directeur général Data - Natixis

  • Antoine Le Feuvre - VP Digital Solutions - Suez

class="img-responsive

Medium Blog par Artefact.

Cet article a été initialement publié sur Medium.com.
Suivez-nous sur notre Medium Blog !