Article rédigé pour le blog Medium par Artefact , en collaboration avec la French Tech Corporate Community.
La multitude et la diversité des réactions suscitées par ChatGPT et d’autres IA génératives, qu’elles soient sceptiques ou enthousiastes, témoignent des changements qu’elles entraînent et de leur impact bien au-delà des cercles technologiques habituels. Cela contraste fortement avec les générations précédentes d’IA, qui étaient essentiellement prédictives et faisaient généralement l’objet d’articles ou de thèses cantonnés au domaine de la recherche et de l’innovation.
Pour les entreprises, l'IA générative se distingue également des intelligences artificielles précédentes. Si l'on compare ces technologies aux plus proches d'elles, telles que le traitement du langage naturel (NLP) pour les corpus textuels ou la vision par ordinateur pour data audiovisuelles, les IA génératives apportent quatre changements majeurs dont les entreprises prennent conscience à mesure qu'elles les expérimentent.
Premièrement, par rapport aux IA précédentes, l'IA générative accélère considérablement le déploiement des cas d'utilisation, dans la mesure où elle permet d'accélérer la validation de principe. Deuxièmement, elle ouvre un nouveau champ de possibilités, permettant une valorisation plus simple, plus efficace et moins coûteuse des data non structurées. De plus, les résultats obtenus avec l'IA générative sont inédits en termes de qualité, de quantité et de diversité par rapport aux modèles utilisés auparavant. Tous ces facteurs impliquent que nous devons répondre aux attentes accrues des utilisateurs finaux, alimentées par l'engouement suscité par cette technologie. Nous développons ces quatre points ci-dessous.
L'IA générative permet de tester plus rapidement la valeur ajoutée des cas d'utilisation
Dans le domaine de l'IA générative, la mise en œuvre des cas d'utilisation est souvent plus rapide et moins laborieuse qu'avec les IA précédentes. L'approche adoptée avec l'IA générative est fréquemment comparée à un jeu de Lego, où des éléments préexistants peuvent être combinés pour créer de nouveaux résultats. Cette facilité d'expérimentation et de mise en œuvre permet de raccourcir les cycles de développement. De plus, un mode d'interaction conversationnel avec les utilisateurs accélère également l'adoption de cette technologie.
Un cas data peut se résumer à un problème métier, data, un modèle et une instruction. Traditionnellement, la création et l'optimisation du modèle constituent la partie la plus complexe et la plus chronophage du processus. Avec l'IA générative, cette étape devient plus simple. L'IA générative fournit des modèles pré-entraînés et prêts à l'emploi, permettant ainsi aux entreprises de bénéficier d'une expertise de pointe sans avoir à consacrer un temps considérable au développement et au perfectionnement des modèles. Dans la pratique, les modèles (tels que GPT 4.0 d'Azure) sont accessibles « à la demande » ou peuvent être déployés via des API (comme Gemini Pro BARD de Google). Certains fournisseurs proposent même des modèles spécialement optimisés pour des domaines spécifiques, tels que la génération de textes juridiques, médicaux ou financiers.
Une fois le modèle déployé, la seule tâche qui reste consiste à « ancrer » le modèle d'IA générative, c'est-à-dire à relier les résultats générés par le modèle à des informations du monde réel afin de contraindre le modèle à répondre dans un périmètre donné. Cela implique souvent d'ajouter des contraintes ou des informations supplémentaires pour guider le modèle vers la production de résultats cohérents et pertinents dans un contexte spécifique. Cependant, cela est bien loin du temps nécessaire pour entraîner les modèles d'IA que nous utilisons jusqu'à présent.
Prenons l'exemple d'un cas d'utilisation d'analyse mot à mot dans un centre d'appels pour illustrer notre propos. Selon une Artefact , pour développer ce type de cas d'utilisation à l'aide de modèles basés sur l'IA classique, il fallait généralement compter trois à quatre semaines entre le moment où les data récupérées et celui où elles devenaient exploitables. Aujourd'hui, grâce à l'IA générative, ce processus ne prend plus qu'une semaine, soit une accélération de plus de trois fois. Le principal défi consiste à choisir la classification métier appropriée pour adapter le modèle.
L'IA générative élargit le champ d'application de l'IA à data jusqu'alors peu utilisées ou mal exploitées
Certains gisements pétroliers ne sont rentables que lorsque les prix du pétrole montent en flèche. Le même principe s'applique aux data. Certaines data non structurées data désormais être exploitées grâce à l'IA générative, ce qui ouvre un tout nouveau champ de data exploitables data l'entraînement ou le réglage fin des modèles, et offre de nombreuses perspectives pour des applications spécialisées dans des domaines spécifiques.
Et une nouvelle perspective se dessine : celle d'IA génératives capables de traiter et de combiner tout type de data leurs processus d'apprentissage, contournant ainsi le travail fastidieux et chronophage consistant à structurer et à améliorer la qualité des data d'entreprise data les rendre exploitables. Une promesse qui, d'après les observations actuelles, n'est pas encore tenue.
L'IA générative n'a pas seulement bénéficié d'une véritable avancée dans le domaine des mécanismes d'attention. Elle a également profité de la puissance sans cesse croissante – et indispensable – des machines.
Les mécanismes d'attention fonctionnent un peu comme la capacité qu'a une personne à se concentrer sur une partie importante d'une image ou d'un texte lorsqu'elle cherche à comprendre ou à créer quelque chose. Imaginez que vous essayez de dessiner un paysage à partir d'une photographie. Plutôt que de regarder l'image dans son ensemble d'un seul coup d'œil, vous vous concentrez sur certaines parties qui vous semblent importantes, comme les montagnes ou les arbres. Cela vous aide à mieux saisir les détails essentiels et à réaliser un dessin plus précis. De la même manière, les mécanismes d'attention permettent au modèle de se concentrer sur des parties spécifiques d'une image ou d'un texte lors de la génération de contenu. Au lieu de traiter toutes les données d'entrée d'un seul coup, le modèle peut se concentrer sur les parties les plus pertinentes et les plus importantes pour produire des résultats plus précis et plus significatifs. Cela lui permet d'apprendre à créer des images, du texte ou d'autres types de contenu de manière plus efficace et plus réaliste.
Les mécanismes d'attention se prêtent très bien au traitement parallèle. L'utilisation de plusieurs mécanismes d'attention permet d'obtenir une représentation plus riche et plus robuste des data, ce qui se traduit par de meilleures performances dans diverses tâches telles que la traduction automatique, la génération de texte, la synthèse vocale, la génération d'images et bien d'autres encore.
En conséquence, des cas d'utilisation qui semblaient impossibles il y a encore peu sont désormais tout à fait réalisables. C'est le cas, par exemple, du calcul du temps de parole dans les médias pendant les campagnes présidentielles. Il y a à peine deux ans, calculer avec précision le temps de parole de chaque candidat était une opération fastidieuse. Aujourd'hui, grâce à l'utilisation de l'IA générative, c'est possible.
En ce qui concerne les capacités de calcul, il y a six ans, OpenAI a publié une analyse montrant que, depuis 2012, la quantité de calculs utilisés dans les sessions d'entraînement en IA les plus importantes a augmenté de manière exponentielle, avec un temps de doublement de 3,4 mois (à titre de comparaison, la loi de Moore prévoyait un temps de doublement de deux ans). Depuis 2012, cette mesure a été multipliée par plus de 300 000 (un temps de doublement de deux ans n'aurait entraîné qu'une multiplication par sept).
Les modèles d'IA générative nécessitent souvent d'énormes capacités de calcul pour leur apprentissage, d'autant plus qu'ils sont conçus pour être polyvalents et ont besoin de vastes quantités de contenu pour s'entraîner. Des ressources informatiques puissantes, telles que des GPU haut de gamme ou des TPU, sont nécessaires pour traiter de grands ensembles de données et exécuter des algorithmes d'optimisation complexes. Le nouveau GPU NVIDIA A100 Tensor Core semble offrir une accélération sans précédent. Selon NVIDIA, l'A100 offre des performances jusqu'à 20 fois supérieures à celles de la génération précédente et peut être partitionné en sept instances de GPU pour s'adapter dynamiquement à l'évolution des besoins. Il disposerait également de la bande passante mémoire la plus rapide au monde, avec plus de deux téraoctets par seconde (To/s), permettant ainsi d'exécuter les modèles et les ensembles de données les plus volumineux.
Il convient de noter que les progrès réalisés dans le domaine de l'informatique ont joué un rôle essentiel dans l'évolution de l'intelligence artificielle. Tant que cette tendance se poursuivra, nous devrons nous préparer aux implications de systèmes dont les capacités dépasseront de loin celles d'aujourd'hui et qui repousseront encore plus loin les limites, tout en évaluant la valeur ajoutée de ces systèmes par rapport aux coûts qu'ils engendrent, notamment en termes d'énergie et d'environnement. Nous aborderons ces points dans un prochain article.
L'IA générative améliore la diversité, la qualité et la quantité des résultats obtenus
L'IA générative se distingue clairement des formes précédentes d'IA par l'impact qu'elle a sur les résultats produits par ses modèles. Non seulement la quantité de résultats générés a augmenté, mais leur qualité et leur diversité se sont également améliorées. Toutefois, tous ces aspects positifs doivent être relativisés par une reproductibilité moindre des modèles d'IA générative.
Si l'on prend l'exemple d'un puzzle, data peut être comparée à son assemblage, chaque data une pièce à placer afin de révéler une image cohérente. L'IA joue un rôle essentiel en tentant de combler les data manquantes, data utilisant les informations disponibles pour déduire et recréer ces pièces manquantes. L'IA générative va au-delà de la simple complétion data existantes data créant data nouvelles data de ce qui existe déjà. Ce processus élargit les capacités d'analyse et permet de découvrir de nouvelles informations à partir data existantes, mettant ainsi l'aspect génératif au premier plan.

Contrairement aux générations précédentes d'IA, qui ont tendance à produire des résultats souvent similaires, les modèles d'IA générative sont capables de générer une plus grande diversité de résultats en explorant différentes variations et alternatives. Cette diversité accrue permet de créer un contenu plus riche et plus varié, passant ainsi du quantitatif au qualitatif et couvrant un éventail plus large de besoins et de préférences.
OpenAI s'est récemment rendu à Hollywood pour présenter son tout dernier modèle, baptisé « Sora », capable de générer des vidéos à partir de texte. « C'est une chose d'entendre dire qu'il est capable de faire tout cela, mais en voir les capacités de ses propres yeux était tout simplement stupéfiant », a déclaré le producteur hollywoodien Mike Perry, soulignant la diversité et la qualité des fonctionnalités offertes par l'IA générative.
Cependant, en raison de leur capacité à explorer un éventail plus large de possibilités, les modèles d'IA générative peuvent être moins reproductibles que les IA précédentes, ce qui compromet la précision des résultats. Concrètement, il est plus difficile d'obtenir exactement les mêmes résultats à chaque exécution du modèle, ce qui peut poser des problèmes de fiabilité et de prévisibilité dans certaines applications critiques.
Cette limite représente un défi majeur pour les applications d'IA générative qui nécessitent des réponses précises. C'est d'ailleurs un domaine sur lequel les entreprises se penchent actuellement dans le cadre de leurs développements : elles cherchent à mieux spécialiser les modèles dans des domaines très spécifiques afin d'améliorer la précision des réponses, et à associer la robustesse des modèles basés sur des règles ou des requêtes sur data structurées data la facilité d'utilisation et data l'interaction avec les utilisateurs propres aux IA génératives, en reliant ces dernières aux résultats des premières.
Des attentes accrues de la part des utilisateurs finaux
En matière de gestion des attentes et de la relation des utilisateurs finaux avec la technologie, l'IA générative pose plusieurs défis spécifiques. En raison de sa capacité à produire des résultats rapidement, l'IA générative peut susciter des attentes particulièrement élevées. À l'inverse, l'apparition d'« hallucinations » et de résultats indésirables peut fortement ébranler la confiance des utilisateurs dans ces solutions.
L'IA générative est capable de produire des résultats rapidement et de manière automatisée, ce qui peut donner aux utilisateurs finaux l'impression que cette technologie est en mesure de résoudre tous leurs problèmes instantanément et efficacement. Cela peut susciter des attentes démesurées quant aux capacités réelles de l'IA générative, et entraîner une déception si les résultats ne répondent pas pleinement à ces attentes élevées.
L'IA générative n'est bien sûr pas parfaite et peut parfois produire des résultats inattendus ou indésirables, tels que des contenus incohérents, erronés ou inappropriés. L'apparition de tels résultats indésirables peut entraîner une perte de confiance des utilisateurs finaux dans cette technologie, remettant en question sa fiabilité et son utilité. Elle peut également susciter des inquiétudes quant à data et à la confidentialité data lorsque des résultats inattendus compromettent l'intégrité des informations générées par l'IA générative.
En février 2023, le chatbot de Google, Bard (rebaptisé Gemini), a fourni des informations erronées lorsqu’on lui a posé une question sur les découvertes du télescope spatial James Webb de la NASA. Il a affirmé à tort que le télescope avait pris les premières photos d’une exoplanète. Cette affirmation est erronée, car les premières photos d'une exoplanète remontent à 2004, alors que le télescope James Webb n'a été lancé qu'en 2021 (source : équipe CNET France, 2024).
Il est donc essentiel que les utilisateurs finaux des systèmes d'IA générative soient conscients de leurs limites. C'est pourquoi la plupart des entreprises qui déploient ces solutions s'efforcent d'accompagner les utilisateurs dans leur utilisation : en les formant à l'art de formuler des requêtes, en leur expliquant les limites de ces systèmes, en précisant quelles attentes peuvent ou ne peuvent pas être satisfaites, et en leur rappelant les règles applicables en matière de data .
Plus d'un an après le lancement de ChatGPT, les attentes vis-à-vis de cette nouvelle technologie sont toujours aussi élevées. Cependant, la valeur qui lui est attribuée ne s'est pas encore concrétisée dans des cas d'utilisation concrets. Dans notre prochain article, nous aborderons des thèmes liés à l'adoption de cette technologie par les entreprises et à sa diffusion au sein de celles-ci.
Sous la direction de :

BLOG





