Victor Coimbra a été reconnu dans la liste Forbes Under 30 Brazil pour ses contributions exceptionnelles à l'innovation dans le domaine de l'IA. Il a cofondé les opérations latino-américaines de Artefact, qui constituent aujourd'hui un pôle technologique mondial comptant 200 employés. Il apporte une expertise approfondie dans la mise à l'échelle des solutions d'IA et la création d'équipes technologiques performantes sur les marchés internationaux.

En Première partie, Nous avons examiné le problème : les systèmes d'IA se dégradent avec le temps, les performances de référence masquent les échecs de production, et même les professionnels expérimentés peuvent travailler plus lentement avec l'aide de l'IA que sans elle. La trajectoire est prometteuse. La réalité actuelle est désordonnée.

Alors, comment construire des systèmes qui soutiennent réellement l'effort pendant des heures ?

Trois approches ont émergé de différentes communautés, chacune s'attaquant au même problème fondamental : comment un système d'intelligence artificielle peut-il maintenir un progrès cohérent lorsque sa mémoire de travail est limitée ?

Approche 1 : Cyclisme du nouveau départ

Fin 2025, une technique au nom absurde de " Ralph Wiggum " est devenue virale chez les praticiens. Ce nom vient d'un personnage des Simpsons – délibérément ridicule, car l'idée centrale est presque embarrassante de simplicité.

Laissez l'IA travailler. Lorsqu'elle commence à se dégrader, arrêtez-la. Recommencez à zéro. Laissez-la reprendre là où elle s'est arrêtée.

C'est tout. L'IA travaille sur une tâche jusqu'à ce que ses performances commencent à diminuer. Elle s'arrête alors, enregistre ses progrès dans un fichier et quitte le système. Une nouvelle session commence avec une ardoise vierge. L'IA lit ce qui a été accompli, identifie ce qui reste à faire et continue.

La philosophie : arrêtez de lutter contre la limitation de la mémoire. Travaillez avec. Chaque session de travail fonctionne de manière indépendante. Le progrès réside dans les documents et les enregistrements, pas dans la tête de l'IA.

Ce que cela donne en pratique

Une mise en œuvre typique se déroule en trois phases :

  • Phase 1 (exigences) : L'homme et l'IA collaborent pour identifier ce qui doit être fait. Le résultat est un document de spécification clair.
  • Phase 2 (planification) : L'IA analyse l'écart entre la spécification et l'état actuel. Résultat : une liste de tâches classées par ordre de priorité. Il n'y a pas encore de travail effectif.
  • Phase 3 (exécution) : L'IA traite une tâche par session. Terminez la tâche, vérifiez qu'elle a fonctionné, documentez ce qui a été fait, quittez. Nouvelle session. Répétez l'opération.

La contrainte principale est que les tâches doivent être clairement mesurables. Cette approche fonctionne mal pour les exigences ambiguës, les appels au jugement ou les travaux exploratoires sans finalité claire.

Résultats des premiers adoptants

Les chiffres fournis par les praticiens sont frappants, bien qu'ils proviennent de l'auto-reports plutôt que d'études contrôlées.

Un consultant a réalisé ce qui aurait été un projet de $50 000 pour moins de $300 en coûts d'IA - en exécutant des sessions automatisées pendant la nuit. Une équipe de démarrage a réalisé six livrables majeurs en une nuit, avec des résultats, des vérifications et une documentation fonctionnels. Un praticien a construit un produit entier en trois mois de sessions automatisées.

Les coûts typiques varient de $50 à 100 pour des projets importants comportant plus de 50 sessions de travail. Chaque session dure de 30 à 45 minutes avant de se dérouler à vélo.

Anthropic a formalisé cette approche en décembre 2025, en publiant un support officiel. Le modèle est passé du statut de solution de contournement à celui de méthodologie approuvée.

La limitation

Cette approche est déterministe dans un monde imprévisible. Comme le dit un praticien, “il vaut mieux échouer de manière prévisible que réussir de manière imprévisible” : "Il vaut mieux échouer de manière prévisible que réussir de manière imprévisible".”

C'est à la fois une force et une contrainte. Le cyclisme du nouveau départ fonctionne lorsque vous pouvez définir clairement le succès. Il se heurte à des difficultés lorsque le succès est subjectif, lorsque la qualité est implicite et lorsque la “bonne” réponse nécessite un jugement humain pour être reconnue.

Approche 2 : Mémoire sélective

Le cycle Fresh-start élimine tout ce qui se trouve entre les sessions. Chaque cycle commence par un nouveau départ. Et si vous pouviez préserver sélectivement les éléments importants ?

La mémoire sélective adopte une approche différente : elle extrait et stocke les informations essentielles et rejette le reste. Au lieu de tout recommencer, l'IA hérite d'un résumé de ce qui est important.

Le modèle à deux rôles

Une mise en œuvre courante utilise deux rôles d'IA spécialisés :

  • Rôle de mise en place : Ne fonctionne qu'au début. Établit le contexte, identifie les informations clés, crée les documents de référence initiaux.
  • Rôle de travail : Gère toutes les sessions suivantes. Maintient la continuité grâce à trois artefacts : un suivi de l'avancement des travaux montrant les travaux terminés et en attente, une liste de contrôle avec les éléments marqués comme étant terminés ou restants, et un historique des changements montrant ce qui a été modifié et pourquoi.

Le démarrage de la session est explicite : confirmer l'état actuel, examiner les documents relatifs à l'état d'avancement, sélectionner les travaux restants les plus prioritaires, vérifier la ligne de base avant d'entreprendre de nouveaux travaux.

La différence par rapport au cyclisme de départ : l'étape de la compression. Le rôle de travail hérite d'un résumé du contexte pertinent. Les recherches suggèrent que cette approche peut permettre à l'intelligence artificielle d'accomplir de longues séquences de tâches en n'utilisant que 16% des informations dont elle aurait eu besoin autrement. Soit une réduction de 84% des frais généraux.

Mémoire avancée : Préservation des relations

L'état de l'art en matière de mémoire sélective permet de préserver non seulement les faits, mais aussi les relations.

Réfléchissez à la manière dont les humains se souviennent des projets. Nous ne nous souvenons pas seulement de faits isolés. Nous nous souvenons que telle décision a entraîné telle conséquence, que telle personne assume telle responsabilité, que tel document est lié à telle exigence. Les liens sont aussi importants que le contenu.

Les systèmes de mémoire IA avancés saisissent aujourd'hui ces relations. Lorsqu'ils stockent des informations, ils extraient non seulement ce qui s'est passé, mais aussi qui était impliqué, à quoi cela était lié et pourquoi c'était important. Lorsqu'ils récupèrent des informations, ils peuvent reconstituer le contexte en suivant ces fils de relations.

Les mesures de performance de ces systèmes : 26% amélioration des évaluations de la qualité. 90%+ réduction de la surcharge d'information tout en maintenant la cohérence. Meilleure gestion des tâches qui s'étendent sur plusieurs sessions.

Le compromis

La mémoire sélective ajoute à la complexité. Vous avez besoin d'une infrastructure de stockage et de récupération. Vous devez décider ce qu'il faut garder et ce qu'il faut jeter. Vous devez vous assurer que la compression préserve ce qui est important.

Ce problème n'est pas résolu. Les systèmes de mémoire peuvent perdre des détails essentiels. La compression peut introduire des distorsions subtiles. L'intelligence artificielle peut récupérer le mauvais contexte au mauvais moment. La réduction du 84% semble impressionnante jusqu'à ce que le 16% que vous avez conservé perde quelque chose d'essentiel.

Approche 3 : Coordination de l'équipe

Et si la réponse n'était pas une IA dotée d'une meilleure mémoire, mais plusieurs systèmes d'IA aux rôles bien définis ?

La coordination d'équipe décompose le travail complexe en rôles spécialisés coordonnés par un responsable central. Chaque rôle a un champ d'action limité, des besoins d'information limités et un travail spécifique. Le responsable conserve la vue d'ensemble et ne transmet que les informations pertinentes à chaque travailleur.

Le motif en coulisse

Les principales entreprises d'intelligence artificielle l'utilisent en interne. La structure :

Coordinateur : Un système d'intelligence artificielle capable d'analyser les demandes, de planifier l'approche, de conserver la mémoire et de diriger les spécialistes.

Spécialistes : Systèmes d'IA ciblés fonctionnant en parallèle pour des tâches spécifiques.

Résultat : les systèmes basés sur le travail d'équipe sont 90% plus performants que les systèmes d'IA individuels dans les tâches de recherche complexes. Il ne s'agit pas d'une amélioration marginale. Il s'agit d'un quasi-doublement des performances.

L'idée clé : la gestion de l'information explique 80% des différences de performance dans l'IA en équipe. Les outils et les modèles d'IA spécifiques importent moins que la manière dont l'information circule entre les rôles.

Deux modèles de coordination

Modèle de transfert : Un système d'IA passe le contrôle à un autre en cours de tâche. Chacun est au courant de l'existence des autres et décide du moment où il doit s'en remettre à eux. Le travail se poursuit, mais la responsabilité est transférée. Ce système fonctionne bien pour les flux de travail séquentiels et échelonnés.

Modèle de gestionnaire : Un coordinateur central assigne le travail aux spécialistes et collecte les résultats. Les spécialistes renvoient les résultats ; le coordinateur garde le contrôle et prend les décisions. Il n'y a pas de transfert du fil principal. Fonctionne bien pour le traitement parallèle et la synthèse des résultats.

Le choix dépend de votre flux de travail. Les transferts fonctionnent bien lorsque les tâches se décomposent naturellement en étapes. Les modèles de gestionnaire fonctionnent bien lorsque vous avez besoin d'un traitement parallèle avec une prise de décision centralisée.

Normalisation de l'industrie

En 2025, l'industrie a normalisé la manière dont les systèmes d'IA se connectent entre eux et aux ressources externes. Pensez-y comme à la normalisation des prises électriques : les produits de différents fabricants peuvent désormais fonctionner ensemble.

Une norme définit la manière dont l'IA se connecte aux sources d'information et aux outils. Une autre définit la manière dont les systèmes d'intelligence artificielle communiquent entre eux. Ensemble, elles constituent des éléments de base qui peuvent être assemblés dans différentes configurations.

Cet aspect est important car il permet la modularité. Un flux de travail construit par une équipe peut incorporer des composants construits par une autre équipe. Les systèmes de mémoire deviennent interchangeables. Les sources d'information peuvent être découvertes. L“”écosystème de l'IA" n'est pas une question de marketing, c'est une réalité technique que ces normes rendent possible.

Les frais généraux

L'IA en équipe utilise environ 15 fois plus de ressources que l'IA à interaction unique. C'est le coût de la coordination. Pour les tâches simples, ces frais généraux annulent tout avantage. Pour les tâches complexes, l'amélioration de la fiabilité justifie les dépenses.

Les modes de défaillance sont également plus complexes. Une mauvaise conception du transfert a entraîné l'abandon de 40% clients par une entreprise de commerce électronique lorsque les transitions de l'IA ont dérouté les utilisateurs. Les défaillances en cascade peuvent se propager dans les réseaux d'IA. Une analyse de l'industrie de 2025 a identifié 14 modèles de défaillance uniques dans la conception des systèmes, les ruptures de coordination et la vérification de la qualité.

Choisir la bonne approche

Voici ce que je pense de ces options :

  • Cyclisme nouveau départ fonctionne lorsque les tâches sont clairement mesurables, que vous pouvez tolérer des progrès progressifs prévisibles, que les progrès peuvent être entièrement consignés dans des documents et des dossiers, et que vous préférez la simplicité à la sophistication.
  • Mémoire sélective Lorsque les tâches nécessitent de préserver les relations entre les sessions, vous disposez d'une infrastructure de stockage et de récupération, l'efficacité est importante à l'échelle et vous pouvez investir dans des systèmes de compression.
  • Coordination de l'équipe fonctionne lorsque les tâches se décomposent naturellement en sous-tâches spécialisées, que vous avez besoin d'un traitement parallèle, que le surcoût de coordination (15x les ressources) est acceptable et que vous pouvez gérer des modes de défaillance plus complexes.

La plupart des systèmes de production combinent des éléments de ces trois types de systèmes. Un système basé sur l'équipe où chaque spécialiste utilise le cycle du nouveau départ. Un coordinateur à mémoire augmentée qui dirige des travailleurs sans état. Ces approches sont complémentaires et non exclusives.

Le point commun : ces trois approches externalisent les informations que l'IA ne peut pas conserver de manière fiable en interne. Elles se distinguent par la quantité d'informations qu'elles externalisent et par la manière dont elles gèrent leur récupération.

En Troisième partie, Nous examinerons ce que l'IA à long terme signifie pour les organisations : comment le travail change, quelle gouvernance est nécessaire et quelles sont les opportunités réalistes en 2026.

 

Références

Documents de recherche

Rapports sur l'industrie et livres blancs

  • Modes de défaillance des systèmes d'intelligence artificielle - Microsoft
  • Les leçons de 2025 sur l'IA et la confiance - Google Cloud
  • État de l'ingénierie de l'IA - LangChain
  • Évaluation de référence par rapport à l'évaluation en situation réelle - METR

Documentation technique

  • Comment nous avons construit notre système de recherche multi-agents - Anthropic
  • Spécification du protocole de contexte de modèle - modelcontextprotocol.io
  • Documentation sur le cyclisme nouveau départ (“Ralph Wiggum”) - Geoffrey Huntley (ghuntley.com/ralph/)