Introduction

Depuis son émergence fulgurante au milieu de l'année 2022, l'IA générative a rapidement attiré l'attention du monde entier. Ce qui se concentrait initialement sur la modalité linguistique s'est depuis étendu à de nouvelles voies passionnantes, notamment les modèles d'image, d'audio et de vidéo. Au début de l'année 2023, les spéculations sur l'impact potentiel de cette technologie sur les entreprises de divers secteurs se sont multipliées, accompagnées de premiers cas d'adoption prometteurs. À mesure que de plus en plus de développeurs se sont mis à créer des solutions à partir de ces modèles, la perception générale s'est orientée vers l'émergence continue de versions plus récentes, plus puissantes et, espérons-le, plus performantes des modèles les plus largement utilisés.

À l'aube de l'année 2024, un constat essentiel s'impose : le déploiement de l'IA ne se résume pas à adopter le modèle le plus récent et le plus puissant disponible sur le marché. Bien qu'il soit courant de penser que les solutions d'IA sont toutes faites ou que l'augmentation de la taille des modèles conduit automatiquement à de meilleurs résultats, cette approche répond rarement aux besoins spécifiques de la plupart des entreprises. En réalité, pour être efficaces, les applications nécessitent des solutions d'IA sur mesure, flexibles et performantes.

Pour y parvenir, nous nous tournons vers les systèmes d'IA composites. Contrairement aux modèles monolithiques uniques, les systèmes d'IA composites intègrent plusieurs composants d'IA spécialisés, chacun étant optimisé pour un rôle spécifique. Cette structure garantit une grande personnalisation, une grande adaptabilité et une grande précision, transformant ainsi l'IA d'un outil généraliste en une solution sur mesure. En combinant des composants d'IA plus petits et interconnectés, les entreprises peuvent atteindre des performances et des résultats bien supérieurs à ceux des modèles prêts à l'emploi seuls. Par conséquent, pour un impact commercial optimal dans tous les secteurs, nous estimons qu’une vision stratégique devrait privilégier la conception de systèmes plus intelligents plutôt que la simple construction de modèles plus volumineux et plus gourmands en ressources informatiques.

Comprendre les systèmes d'IA composites

Le Berkeley Artificial Intelligence Research Lab (BAIR) définit un système d'IA composite comme un système « qui traite des tâches d'IA à l'aide de multiples composants en interaction, notamment par le biais de multiples appels à des modèles, des systèmes de recherche d'informations ou des outils externes ». Par exemple, le système RAG (Retrieval Augmented Generation) est un système composite qui combine un grand modèle linguistique (LLM), un mécanisme de recherche d'informations et une base de données vectorisée. En revanche, un modèle d'IA générative est un modèle statistique; par exemple, un LLM prédit le prochain token dans un texte à partir de data d'entraînement.

Dans ce contexte, un modèle peut être considéré comme un bloc unique, tandis qu'un système d'IA composite s'apparente davantage à une machine composée de plusieurs modules, chacun remplissant une fonction spécifique pour atteindre l'objectif global du système.

Systèmes d'IA composites - Modèles vs systèmes d'IA composites.

Modèles vs systèmes composites basés sur l'IA. Source

En quoi ces systèmes sont-ils utiles ?

Spécialisation : un gros marteau n'est pas l'outil qui convient à toutes les situations

Lorsqu'il s'agit de répondre à des applications spécifiques ou aux besoins d'un secteur donné, s'appuyer sur un modèle d'IA polyvalent tel que GPT-4 peut s'avérer insuffisant. Bien que puissants, ces modèles sont conçus pour traiter un large éventail de tâches et peuvent ne pas disposer des connaissances spécialisées requises pour certaines applications, ce qui entraîne une baisse de rendement au-delà d'un certain seuil.

Par exemple, un établissement financier souhaitant développer un chatbot dédié à l'analyse d'investissement ou à la gestion de patrimoine a besoin d'un système intégrant à la fois des connaissances spécialisées et une expertise propre à l'entreprise. Compte tenu de la nature du secteur, des préoccupations se poseraient en matière de confidentialité (l'entreprise pourrait exiger des solutions sur site et l'utilisation exclusive de modèles ouverts), de précision (les solutions doivent être d'une précision irréprochable) et d'efficacité. Utiliser même les modèles linguistiques les plus puissants en tant que solution autonome ne serait certainement pas le choix optimal. Au contraire, un système d'IA composite pourrait s'avérer très efficace en intégrant plusieurs composants spécialisés, tels que des systèmes de génération augmentée par la recherche (RAG) et des agents IA sur mesure. Cette approche garantit que chaque partie du système est optimisée pour son rôle spécifique.

Flexibilité : les systèmes modulaires s'adaptent facilement à l'évolution des besoins

Lorsqu'un système est conçu à partir de composants modulaires, le remplacement ou la mise à niveau de certaines pièces devient beaucoup plus simple. Le même principe s'applique aux systèmes d'IA composites, qui sont constitués de plusieurs modules. Si un composant d'une solution d'IA composite devient obsolète ou ne répond plus aux nouvelles exigences de conformité, il peut être remplacé sans qu'il soit nécessaire de procéder à une refonte complète de l'ensemble du système. Par exemple, si un nouveau modèle plus adapté devient disponible, il peut être intégré au système pour remplacer l'ancienne version. De même, si un mécanisme de recherche d'informations plus efficace est développé, il peut être substitué sans perturber l'ensemble de la configuration. Cette flexibilité s'étend au-delà des modèles et des systèmes de recherche à d'autres composants, tels que les unités data , les moteurs d'analyse ou les modules de conformité.

Évolutivité : les essaims de composants intelligents surpassent un seul géant

La nature modulaire des systèmes d'IA composites offre des avantages considérables en termes d'évolutivité. En permettant d'adapter chaque composant de manière indépendante, ces systèmes peuvent gérer efficacement data et une complexité croissants sans nécessiter de refonte complète.

Un système peut être mis à l'échelle en le reproduisant au sein d'un réseau de systèmes, ce qui permet en théorie une évolutivité infinie. C'est pourquoi un modèle linguistique unique, aussi volumineux et puissant soit-il (à l'heure actuelle), ne peut pas effectuer efficacement une recherche d'une information spécifique dans une très grande base de données. Pour étendre les capacités de recherche d'un modèle, il est inévitable de créer un système à plusieurs composants afin d'améliorer la fonction de recherche. Si même les tâches les plus simples, comme la recherche d'informations, ne peuvent pas être efficacement mises à l'échelle par un seul modèle, il apparaît clairement que les composants individuels, pris isolément, ne peuvent pas prendre en charge des applications complexes à grande échelle.

Pourquoi les systèmes d'IA combinés sont-ils judicieux sur le plan commercial ?

D'un point de vue commercial, l'adoption de systèmes d'IA composites va au-delà de la simple sophistication technique : elle offre des avantages stratégiques qui s'alignent directement sur les objectifs de l'entreprise. On pourrait même affirmer que si une entreprise souhaite tirer parti de l'IA générative, elle n'a d'autre choix que de développer (ou d'acquérir) un système composite. Bien que cela puisse sembler évident, cela remet en question l'idée reçue selon laquelle des modèles autonomes et prêts à l'emploi suffisent pour répondre à des besoins spécifiques.

Amélioration de la satisfaction client

À eux seuls, les modèles d'IA les plus avancés ne peuvent pas créer une expérience personnalisée. Cela ne peut être réalisé qu'à travers un système intégré permettant d'offrir des expériences client hautement personnalisées et adaptées au contexte. Par exemple, Custom Neural Voice de Microsoft combine des modèles de langage généraux (LLM) avec un entraînement vocal personnalisé, permettant aux marques de créer des assistants numériques qui correspondent parfaitement à leur ton et à leur style uniques. Ce niveau de personnalisation est particulièrement efficace dans les secteurs en contact direct avec la clientèle, tels que la publicité, où les clients réagissent positivement lorsqu’ils se sentent privilégiés et compris. D’un point de vue commercial, la combinaison de cette technologie avec la capacité d’ajouter du contexte aboutit à des résultats personnalisés, ce qui, en fin de compte, favorise la satisfaction client.

Rentabilité

Contrairement aux modèles individuels qui offrent un niveau de qualité fixe à un coût fixe, l'IA composite propose des configurations souples en termes de rapport coût-qualité. Par exemple, les entreprises peuvent intégrer un modèle plus petit, optimisé pour des tâches spécifiques, à des composants spécialisés, tels que des algorithmes de recherche heuristique, afin d'obtenir des résultats de haute qualité à un coût moindre par rapport à des modèles autonomes plus volumineux. Cette flexibilité permet d'utiliser des modèles plus petits, potentiellement open source, qui, grâce à une ingénierie ciblée, peuvent fournir des résultats comparables à ceux de solutions plus coûteuses.

Meilleur contrôle et plus de confiance

Pour les entreprises, la fiabilité et la crédibilité des résultats générés par l'IA sont cruciales. Se fier uniquement à des modèles individuels peut rendre difficile l'obtention de résultats toujours factuels et correctement formatés. Par exemple, un ancien client du secteur de l'éducation m'avait un jour demandé de mettre au point une solution permettant de remplir automatiquement des formulaires de candidature à partir data informations de son établissement. Au départ, j'ai passé des mois à élaborer un système séquentiel basé sur une ingénierie avancée des invites, sans recourir à une approche combinée. Les résultats se sont améliorés, mais ils n'ont jamais été suffisamment proches de ce que nous pouvions présenter comme des formulaires de candidature entièrement remplis. Ce n'est qu'avec l'introduction du concept de RAG que des résultats entièrement contrôlés ont commencé à apparaître. Cependant, même le RAG seul ne suffisait pas ; des composants supplémentaires étaient nécessaires pour catégoriser les informations, maintenir la cohérence du contexte et gérer d'autres nuances. Ce n'est qu'alors que nous avons atteint la fiabilité et la précision dont le client avait besoin.

Conclusion

L'analyse du paysage actuel de l'IA dans les applications industrielles fait apparaître une tendance claire : s'appuyer sur un seul modèle pour exécuter des fonctions complexes s'avère souvent peu fiable. À mesure que les cas d'utilisation se complexifient et que l'adoption par les entreprises s'intensifie, la demande en solutions d'IA hautement spécialisées et performantes devrait augmenter. Pour répondre à cette demande, il est nécessaire de mettre en place une architecture de solution intégrant des modèles améliorés et spécialisés, en évitant ainsi l'écueil d'une portée trop étroite et unilatérale.

La communauté des développeurs est en effervescence grâce à des applications passionnantes couvrant des domaines allant de la médecine au commerce de détail, toutes conçues en assemblant des composants plus petits et spécialisés pour former des solutions puissantes et sur mesure.

Même l'IA, à elle seule, n'est pas assez intelligente pour atteindre des objectifs commerciaux stratégiques. Elle doit être complétée par une forme supérieure d'intelligence coordonnée.

Annexe

Exemples de systèmes d'IA composites

Voici une sélection de systèmes d'IA composites à la fois percutants et intéressants, qui mettent en évidence l'utilité de ce concept. Quelle que soit l'infrastructure utilisée par les développeurs, l'objectif est d'observer comment la combinaison de plusieurs composants d'IA avec d'autres outils permet d'atteindre un objectif très précis.

La technologie RAG améliore les résultats d'un modèle de langage à grande échelle (LLM) en lui fournissant un contexte spécifique issu d'une base de données vectorisée qui ne fait pas partie des data d'entraînement initiales du modèle. Alors que les LLM sont entraînés sur de vastes ensembles de données et s'appuient sur des milliards de paramètres pour générer des réponses, la technologie RAG va encore plus loin. Elle permet au LLM d'accéder à des informations spécifiques et actualisées, qu'elles soient propres à un domaine particulier ou issues de la base de connaissances interne d'une organisation, et de s'y référer. Ce processus améliore considérablement la pertinence, la précision et l'utilité du contenu généré, sans qu'il soit nécessaire de réentraîner le modèle.

Les entreprises disposant de vastes ensembles de données et ayant besoin d'une méthode efficace pour organiser leurs connaissances internes peuvent déployer cette solution sur site, en utilisant le modèle de leur choix, afin d'extraire des informations précises. Par exemple, les analystes financiers peuvent rapidement localiser data pertinentes data les rapports historiques sans avoir à les passer au crible manuellement un par un. Le modèle, enrichi par ces informations contextuelles, génère également des réponses plus précises et plus utiles, ce qui rationalise l'ensemble du processus de recherche d'informations.

Voici une architecture RAG type :

Article : Systèmes d'IA composites : architecture RAG générale

Architecture générale du RAG

Voici un tableau présentant quelques systèmes d'IA composites courants (source) :

Article : Systèmes d'IA composites

Lectures complémentaires sur d'autres systèmes d'IA composés intéressants