Victor Coimbra wurde für seine herausragenden Beiträge zur AI in die „Forbes Under 30 Brazil“-Liste aufgenommen. Er war Mitbegründer der lateinamerikanischen Niederlassung Artefact, die heute als globaler Technologie-Hub mit 200 Mitarbeitern fungiert. Er verfügt über fundierte Fachkenntnisse in der Skalierung AI und dem Aufbau leistungsstarker Tech-Teams auf internationalen Märkten.
In Teil 1 haben wir das Problem beleuchtet: AI verlieren mit der Zeit an Leistungsfähigkeit, Benchmark-Ergebnisse verschleiern Fehler in der Praxis, und selbst erfahrene Fachleute arbeiten mit AI unter Umständen langsamer als ohne. Die Entwicklung ist vielversprechend. Die aktuelle Realität ist jedoch chaotisch.
Wie entwickelt man also Systeme, die auch über mehrere Stunden hinweg leistungsfähig bleiben?
Aus verschiedenen Fachkreisen sind drei Ansätze hervorgegangen, die sich alle mit demselben grundlegenden Problem befassen: Wie kann ein AI einen kohärenten Fortschritt aufrechterhalten, wenn sein Arbeitsgedächtnis begrenzt ist?
Ansatz 1: Fresh-Start-Zyklus
Ende 2025 verbreitete sich unter Fachleuten eine Technik mit dem absurden Namen „Ralph Wiggum“ wie ein Lauffeuer. Der Name stammt von einer Figur aus den Simpsons – bewusst albern gewählt, denn die Grundidee ist fast schon peinlich einfach.
Lass die AI . Wenn die Qualität nachlässt, stopp sie. Fang von vorne an. Lass sie dort weitermachen, wo sie aufgehört hat.
Das ist alles. Die AI an einer Aufgabe, bis ihre Leistung nachlässt. Dann hält sie an, speichert ihren Fortschritt in einer Datei und beendet den Vorgang. Eine neue Sitzung beginnt bei Null. Die AI , was bereits erreicht wurde, ermittelt, was noch zu tun ist, und macht weiter.
Die Philosophie: Hör auf, gegen die Speicherbeschränkung anzukämpfen. Arbeite damit. Jede Arbeitssitzung läuft unabhängig ab. Der Fortschritt speichert sich in Dokumenten und Aufzeichnungen, nicht im Kopf AI.
Wie das in der Praxis aussieht
Eine typische Umsetzung umfasst drei Phasen:
- Phase 1 (Anforderungen): Mensch und AI , um zu ermitteln, was zu tun ist. Das Ergebnis ist ein klares Spezifikationsdokument.
- Phase 2 (Planung): AI die Diskrepanz zwischen der Spezifikation und dem aktuellen Stand. Ergebnis: eine nach Priorität geordnete Aufgabenliste. Es wird noch keine konkrete Arbeit geleistet.
- Phase 3 (Ausführung): AI eine Aufgabe pro Sitzung. Die Aufgabe wird ausgeführt, das Ergebnis überprüft, die durchgeführten Schritte dokumentiert und die Sitzung beendet. Neue Sitzung. Wiederholen.
Die wichtigste Einschränkung: Aufgaben müssen einen klar messbaren Abschluss haben. Dieser Ansatz eignet sich schlecht für mehrdeutige Anforderungen, Ermessensentscheidungen oder explorative Arbeiten ohne klare Endpunkte.
Ergebnisse von Early Adopters
Die Zahlen der Praktiker sind beeindruckend, auch wenn sie aufreports auf kontrollierten Studien beruhen.
Ein Berater realisierte ein Projekt, das eigentlich 50.000 Dollar gekostet hätte, für weniger als 300 Dollar an AI – indem er automatisierte Sitzungen über Nacht laufen ließ. Ein Startup-Team schloss über Nacht sechs wichtige Arbeitspakete mit funktionsfähigen Ergebnissen, Verifizierung und Dokumentation ab. Ein Praktiker entwickelte in drei Monaten automatisierter Sitzungen ein komplettes Produkt.
Die Kosten liegen in der Regel zwischen 50 und 100 Dollar für umfangreiche Projekte mit mehr als 50 Arbeitssitzungen. Jede Sitzung dauert 30 bis 45 Minuten vor dem Radfahren.
Anthropic hat diesen Ansatz im Dezember 2025 formalisiert und offizielle Unterstützung dafür bereitgestellt. Das Verfahren entwickelte sich von einer Notlösung zu einer anerkannten Methodik.
Die Einschränkung
Dieser Ansatz ist deterministisch in einer unvorhersehbaren Welt. Ein Praktiker drückt es so aus: „Es ist besser, vorhersehbar zu scheitern, als unvorhersehbar Erfolg zu haben.“
Das ist zugleich die Stärke und die Einschränkung. Der „Neustart-Zyklus“ funktioniert, wenn man Erfolg klar definieren kann. Er stößt auf Schwierigkeiten, wenn Erfolg subjektiv ist, wenn Qualität implizit ist und wenn die „richtige“ Antwort nur durch menschliches Urteilsvermögen erkannt werden kann.
Ansatz 2: Selektives Gedächtnis
Beim „Fresh-Start“-Zyklus wird zwischen den Sitzungen alles gelöscht. Jeder Zyklus beginnt völlig neu. Was wäre, wenn man die wichtigen Teile gezielt behalten könnte?
Das selektive Gedächtnis verfolgt einen anderen Ansatz: Es extrahiert und speichert die wesentlichen Informationen und verwirft den Rest. Anstatt ganz von vorne anzufangen, AI die AI eine kuratierte Zusammenfassung dessen, was wichtig ist.
Das Zwei-Rollen-Modell
Eine gängige Umsetzung nutzt zwei spezielle AI :
- Einrichtungsrolle: Wird nur zu Beginn ausgeführt. Legt den Kontext fest, ermittelt wichtige Informationen und erstellt erste Referenzdokumente.
- Aufgabe: Ist für alle nachfolgenden Sitzungen zuständig. Gewährleistet die Kontinuität mithilfe von drei Hilfsmitteln: einem Fortschrittsanzeiger, der abgeschlossene und noch ausstehende Aufgaben anzeigt, einer Checkliste mit als erledigt oder noch ausstehend markierten Punkten sowie einem Änderungsprotokoll, aus dem hervorgeht, was geändert wurde und warum.
Der Sitzungsbeginn ist klar geregelt: den aktuellen Stand bestätigen, die Fortschrittsdokumente prüfen, die verbleibenden Aufgaben mit der höchsten Priorität auswählen, die Ausgangsbasis vor Beginn neuer Arbeiten überprüfen.
Der Unterschied zum „Fresh-Start“-Zyklus: der Komprimierungsschritt. Die „Working Role“ übernimmt eine kuratierte Zusammenfassung des relevanten Kontexts. Forschungsergebnisse deuten darauf hin, dass dieser Ansatz es AI ermöglicht, lange Aufgabenfolgen mit nur 16 % der Informationen AI bewältigen, die sie andernfalls benötigen würde. Das entspricht einer Reduzierung des Overheads um 84 %.
Erweiterte Speicherfunktion: Beziehungserhaltung
Der aktuelle Stand der Forschung im Bereich des selektiven Gedächtnisses befasst sich nicht nur mit Fakten, sondern auch mit Zusammenhängen.
Denken Sie einmal darüber nach, wie Menschen sich an Projekte erinnern. Wir rufen uns nicht nur einzelne Fakten ins Gedächtnis. Wir erinnern uns daran, dass diese Entscheidung zu jener Folge geführt hat, dass diese Person für jene Aufgabe verantwortlich ist, dass dieses Dokument mit jener Anforderung zusammenhängt. Die Zusammenhänge sind genauso wichtig wie der Inhalt.
Moderne AI erfassen diese Zusammenhänge mittlerweile. Beim Speichern von Informationen erfassen sie nicht nur, was geschehen ist, sondern auch, wer daran beteiligt war, womit es in Verbindung stand und warum es von Bedeutung war. Beim Abrufen von Informationen können sie den Kontext rekonstruieren, indem sie diesen Beziehungssträngen folgen.
Leistungskennzahlen dieser Systeme: 26 %ige Verbesserung bei Qualitätsbewertungen. Reduzierung des Informationsaufwands um mehr als 90 % bei gleichbleibender Kohärenz. Deutlich verbesserte Abwicklung von Aufgaben, die sich über mehrere Sitzungen erstrecken.
Der Kompromiss
Ein selektives Gedächtnis macht die Sache komplexer. Man benötigt eine Infrastruktur für die Speicherung und den Abruf von Daten. Man muss entscheiden, was aufbewahrt und was verworfen werden soll. Man muss darauf vertrauen, dass bei der Komprimierung das Wesentliche erhalten bleibt.
Dieses Problem ist noch nicht gelöst. Speichersysteme können wichtige Details verlieren. Durch die Komprimierung können subtile Verzerrungen entstehen. Die AI zum falschen Zeitpunkt den falschen Kontext abrufen. Die Reduzierung um 84 % klingt beeindruckend – bis sich herausstellt, dass in den verbleibenden 16 % etwas Wesentliches fehlt.
Ansatz 3: Teamkoordination
Was wäre, wenn die Antwort nicht eine einzige AI besserem Gedächtnis wäre, sondern viele AI mit klar definierten Aufgaben?
Bei der Teamkoordination werden komplexe Aufgaben in spezialisierte Rollen aufgeteilt, die von einem zentralen Manager koordiniert werden. Jede Rolle hat einen klar abgegrenzten Aufgabenbereich, einen begrenzten Informationsbedarf und eine bestimmte Aufgabe. Der Manager behält den Überblick und leitet nur relevante Informationen an die einzelnen Mitarbeiter weiter.
Das Muster hinter den Kulissen
Führende AI nutzen dies intern. Die Struktur:
Koordinator: Ein leistungsfähiges AI , das für die Analyse von Anfragen, die Planung des Vorgehens, die Verwaltung des Arbeitsspeichers und die Steuerung der Spezialisten zuständig ist.
Spezialisten: Auf bestimmte Aufgaben ausgerichtete AI , die parallel arbeiten.
Das Ergebnis: Teamorientierte Systeme übertreffen einzelne AI bei komplexen Forschungsaufgaben um 90 %. Das ist keine marginale Verbesserung, sondern eine fast doppelte Leistungssteigerung.
Die wichtigste Erkenntnis: Das Informationsmanagement erklärt 80 % der Leistungsunterschiede bei teamorientierter AI. Die konkreten Tools und AI spielen eine geringere Rolle als die Art und Weise, wie Informationen zwischen den verschiedenen Rollen fließen.
Zwei Koordinationsmuster
Übergabemuster: Ein AI übergibt die Kontrolle mitten in einer Aufgabe an ein anderes. Jedes System kennt die anderen und entscheidet selbst, wann es die Kontrolle abgibt. Der Arbeitsprozess läuft weiter, doch die Verantwortung wird übertragen. Eignet sich gut für sequenzielle, stufenweise Arbeitsabläufe.
Manager-Muster: Ein zentraler Koordinator weist Spezialisten Aufgaben zu und sammelt die Ergebnisse ein. Die Spezialisten liefern ihre Ergebnisse zurück; der Koordinator behält die Kontrolle und trifft die Entscheidungen. Keine Übergabe des Hauptthreads. Eignet sich gut für die parallele Verarbeitung und die Zusammenführung der Ergebnisse.
Die Wahl hängt von Ihrem Arbeitsablauf ab. Handoffs eignen sich gut, wenn sich Aufgaben auf natürliche Weise in einzelne Phasen unterteilen lassen. Manager-Muster eignen sich gut, wenn Sie eine parallele Bearbeitung mit zentraler Entscheidungsfindung benötigen.
Standardisierung in der Industrie
Im Jahr 2025 hat die Branche die Art und Weise standardisiert, wie AI miteinander und mit externen Ressourcen verbunden werden. Man kann sich das wie die Standardisierung von Steckdosen vorstellen – Produkte verschiedener Hersteller sind nun miteinander kompatibel.
Ein Standard legt fest, wie AI mit Informationsquellen und Tools AI . Ein anderer definiert, wie AI miteinander kommunizieren. Zusammen bilden sie Bausteine, die in verschiedenen Konfigurationen zusammengesetzt werden können.
Das ist wichtig, weil es Modularität ermöglicht. Ein von einem Team erstellter Workflow kann Komponenten enthalten, die von einem anderen Team entwickelt wurden. Speichersysteme werden austauschbar. Informationsquellen werden auffindbar. DasAI ist kein Marketingbegriff – es ist eine technische Realität, die durch diese Standards ermöglicht wird.
Die Gemeinkosten
Teamorientierte AI etwa 15-mal mehr Ressourcen als AI, die auf Einzelinteraktionen basiert. Das ist der Preis für die Koordination. Bei einfachen Aufgaben überwiegt dieser Mehraufwand jeden Nutzen. Bei komplexen Aufgaben rechtfertigt die höhere Zuverlässigkeit den Aufwand.
Auch die Fehlermuster sind komplexer. Aufgrund einer mangelhaften Übergabeplanung verzeichnete ein E-Commerce-Unternehmen eine Abbruchrate von 40 %, da die Nutzer durch AI verwirrt wurden. Kettenreaktionen können sich durch AI ausbreiten. Eine Branchenanalyse aus dem Jahr 2025 identifizierte 14 spezifische Fehlermuster in den Bereichen Systemdesign, Koordinationsprobleme und Qualitätsprüfung.
Die Wahl des richtigen Ansatzes
So sehe ich diese Optionen:
- Das „Fresh-Start“-Modell funktioniert, wenn Aufgaben einen klar messbaren Abschluss haben, Sie mit vorhersehbaren, schrittweisen Fortschritten zufrieden sind, der Fortschritt vollständig in Dokumenten und Aufzeichnungen festgehalten werden kann und Sie Einfachheit gegenüber Komplexität bevorzugen.
- Selektives Speicherverfahren eignet sich, wenn Aufgaben die Aufrechterhaltung von Beziehungen über mehrere Sitzungen hinweg erfordern, Sie über die entsprechende Infrastruktur für Speicherung und Abruf verfügen, Effizienz bei großem Umfang eine Rolle spielt und Sie in die Entwicklung von Komprimierungssystemen investieren können.
- Die Teamkoordination funktioniert, wenn sich Aufgaben auf natürliche Weise in spezialisierte Teilaufgaben unterteilen lassen, eine parallele Bearbeitung erforderlich ist, der Koordinationsaufwand (15-fache Ressourcen) akzeptabel ist und man mit komplexeren Fehlerfällen umgehen kann.
Die meisten Produktionssysteme kombinieren Elemente aller drei Ansätze. Ein teamorientiertes System, in dem jeder Spezialist den „Fresh-Start“-Zyklus nutzt. Ein speichergestützter Koordinator, der zustandslose Worker steuert. Die Ansätze ergänzen sich, schließen sich jedoch nicht gegenseitig aus.
Der gemeinsame Nenner: Alle drei Ansätze lagern Informationen aus, die die AI intern AI zuverlässig verwalten AI . Sie unterscheiden sich darin, in welchem Umfang sie Informationen auslagern und wie sie den Abruf handhaben.
In Teil 3 werden wir untersuchen, was „Long-Running AI für Unternehmen AI : wie sich die Arbeitswelt verändert, welche Governance erforderlich ist und wo im Jahr 2026 realistische Chancen liegen.
Referenzen
Forschungsarbeiten
- Entwicklung produktionsreifer AI skalierbarem Langzeitgedächtnis — arxiv.org/abs/2504.19413
- Eine auf Multi-Graphen basierende Speicherarchitektur für AI arxiv.org/abs/2601.03236
- Messung von AI der Produktion — arxiv.org/abs/2512.04123
Reports Whitepapers
- Fehlerursachen in AI — Microsoft
- Erkenntnisse aus dem Jahr 2025 zu AI Vertrauen – Google Cloud
- Stand der AI – LangChain
- Benchmark-Test vs. Praxistest — METR
Technische Dokumentation
- Wie wir unser Multi-Agenten-Forschungssystem entwickelt haben — Anthropic
- Spezifikation des Model Context Protocol — modelcontextprotocol.io
- „Fresh-Start Cycling“-Dokumentation („Ralph Wiggum“) – Geoffrey Huntley (ghuntley.com/ralph/)

BLOG






