À mesure que les agents IA prennent en charge de plus en plus de tâches telles que la rédaction d'e-mails ou la résolution de problèmes liés au service client, un défi se pose clairement : comment ces agents peuvent-ils communiquer efficacement, non seulement avec les humains, mais aussi avec les systèmes logiciels dont ils dépendent ?

Le monde numérique actuel est conçu pour l'interaction humaine. Des mesures telles que les CAPTCHA et les protocoles anti-bots, destinées à bloquer l'automatisation malveillante, reflètent cette réalité. Les sites web et les applications sont optimisés pour l'expérience humaine, et non pour les besoins de l'IA. Cela crée une inefficacité fondamentale : un agent, tel que l'Operator d'OpenAI, chargé d'interagir sur un site web, doit imiter le comportement humain — cliquer sur des boutons, remplir des formulaires ou naviguer entre les pages. Si cette capacité constitue une prouesse technologique, elle révèle également un problème sous-jacent : au lieu de repenser la manière dont les systèmes pourraient mieux soutenir l'IA, nous forçons l'IA à s'adapter à des systèmes conçus pour nous.

Cette approche fait peser tout le poids de l'adaptation sur l'agent. Celui-ci doit composer avec des API fragmentées, des couches d'authentification et des interfaces qui privilégient la convivialité pour l'utilisateur. Est-ce vraiment la meilleure voie à suivre ? Cela rappelle l'ornithoptère de Léonard de Vinci, une machine volante inspirée du battement d'ailes des oiseaux. Ingénieux, certes, mais les avions modernes, qui ont abandonné cette imitation, ont pris leur envol parce qu'ils ont repensé le problème plutôt que d'essayer de s'inscrire dans les paradigmes existants. La manière dont nous concevons l'IA aujourd'hui risque de répéter cette même erreur, en privilégiant l'adaptation au détriment de l'optimisation.

Certaines initiatives, comme le Model Context Protocol (MCP) d'Anthropic, vont dans la bonne direction en proposant des normes universelles régissant la manière dont les agents interagissent avec les logiciels. Le MCP offre un cadre dans lequel les agents n'ont pas besoin d'imiter les flux de travail humains ni de s'appuyer sur des intégrations sur mesure. Ils peuvent au contraire exécuter des actions directement, via un protocole unifié, en contournant des couches telles que les formulaires ou les saisies en langage naturel. Cette abstraction réduit non seulement les frictions, mais facilite également la mise à l'échelle et la maintenance des systèmes.

Mais le véritable défi demeure : comment repenser les systèmes eux-mêmes ? Les sites web, les applications et les flux de travail ont toujours été conçus pour optimiser l’expérience humaine, ce qui est tout à fait compréhensible. Les humains en étaient les principaux utilisateurs. Aujourd’hui, alors que l’IA occupe une place centrale, ce paradigme semble de plus en plus dépassé. Imposer à l’IA de s’adapter à des systèmes qui n’ont pas été conçus pour elle limite son efficacité et son évolutivité, un peu comme si l’on essayait de moderniser un ornithoptère pour qu’il puisse rivaliser avec un avion à réaction.

La voie à suivre ne consiste pas à renoncer à l'ergonomie humaine, mais à trouver un équilibre avec des systèmes qui intègrent l'automatisation. L'efficacité ne doit pas nécessairement se faire au détriment de la confiance, de la transparence ou du contrôle. Les entreprises qui embrasseront cette évolution ne se contenteront pas de suivre le rythme des changements induits par l'IA : elles les mèneront. Elles établiront les normes d'un monde où l'IA et les systèmes humains coexisteront de manière à améliorer les uns et les autres.

Pour en savoir plus sur les dernières avancées en matière d'IA, abonnez-vous à notre newsletter sur l'IA générative.