{"id":1083984,"date":"2026-02-06T10:30:03","date_gmt":"2026-02-06T10:30:03","guid":{"rendered":"https:\/\/www.artefact.com\/?post_type=blog&#038;p=1083984"},"modified":"2026-02-10T16:20:00","modified_gmt":"2026-02-10T16:20:00","slug":"long-run-ai-agents-part-2-three-approaches-that-actually-work","status":"publish","type":"blog","link":"https:\/\/www.artefact.com\/de\/blog\/long-run-ai-agents-part-2-three-approaches-that-actually-work\/","title":{"rendered":"Langfristige AI-Agenten, Teil 2: Drei Ans\u00e4tze, die tats\u00e4chlich funktionieren"},"content":{"rendered":"<p><em><a href=\"https:\/\/www.linkedin.com\/in\/victor-coimbra-999a02a0\/\" target=\"_blank\" rel=\"noopener\">Victor Coimbra<\/a> wurde in der Forbes Under 30 Brazil Liste f\u00fcr seine herausragenden Beitr\u00e4ge zur KI-Innovation ausgezeichnet. Er war Mitbegr\u00fcnder der lateinamerikanischen Niederlassung von Artefact, die heute als globaler Tech-Hub mit 200 Mitarbeitern fungiert. Er verf\u00fcgt \u00fcber umfassende Erfahrung in der Skalierung von KI-L\u00f6sungen und dem Aufbau von leistungsstarken Technologie-Teams auf internationalen M\u00e4rkten.<\/em><\/p>\n<p>Unter <a href=\"https:\/\/www.artefact.com\/de\/blog\/long-run-ai-agents-part-1-the-problem-nobody-talks-about\/\">Teil 1<\/a>, Wir haben das Problem untersucht: KI-Systeme verschlechtern sich mit der Zeit, Benchmark-Leistungen verschleiern Produktionsfehler, und selbst erfahrene Fachleute arbeiten mit KI-Hilfe langsamer als ohne sie. Die Tendenz ist vielversprechend. Die aktuelle Realit\u00e4t ist chaotisch.<\/p>\n<p>Wie bauen Sie also Systeme auf, die tats\u00e4chlich \u00fcber Stunden hinweg Leistung erbringen?<\/p>\n<p>Es gibt drei Ans\u00e4tze aus verschiedenen Gemeinschaften, die sich alle mit demselben grundlegenden Problem befassen: Wie kann ein KI-System koh\u00e4rente Fortschritte erzielen, wenn sein Arbeitsspeicher begrenzt ist?<\/p>\n<h2>Ansatz 1: Frisch gestarteter Radsport<\/h2>\n<p>Ende 2025 ging eine Technik mit dem absurden Namen \"Ralph Wiggum\" unter Praktikern viral. Der Name stammt von einer Simpsons-Figur \u2013 bewusst albern, denn die Kernidee ist fast schon peinlich einfach.<\/p>\n<p>Lassen Sie die KI arbeiten. Wenn sie anf\u00e4ngt, sich zu verschlechtern, stoppen Sie sie. Beginnen Sie neu. Lassen Sie sie dort weitermachen, wo sie aufgeh\u00f6rt hat.<\/p>\n<p>Das war's. Die KI arbeitet an einer Aufgabe, bis ihre Leistung nachl\u00e4sst. Dann h\u00e4lt sie an, speichert ihren Fortschritt in einer Datei und beendet die Sitzung. Eine neue Sitzung beginnt mit einem Neuanfang. Die KI liest, was erreicht wurde, identifiziert, was noch fehlt, und macht weiter.<\/p>\n<p>Die Philosophie: H\u00f6ren Sie auf, die Speicherbegrenzung zu bek\u00e4mpfen. Arbeiten Sie mit ihr. Jede Arbeitssitzung arbeitet unabh\u00e4ngig. Der Fortschritt findet in Dokumenten und Aufzeichnungen statt, nicht im Kopf der KI.<\/p>\n<h3>So sieht das in der Praxis aus<\/h3>\n<p>Eine typische Implementierung verl\u00e4uft in drei Phasen:<\/p>\n<ul>\n<li><strong>Phase 1 (Anforderungen):<\/strong> Mensch und KI arbeiten zusammen, um zu ermitteln, was getan werden muss. Das Ergebnis ist ein klares Spezifikationsdokument.<\/li>\n<li><strong>Phase 2 (Planung):<\/strong> KI analysiert die L\u00fccke zwischen der Spezifikation und dem aktuellen Stand. Ergebnis: eine nach Priorit\u00e4ten geordnete Liste von Aufgaben. Noch keine eigentliche Arbeit.<\/li>\n<li><strong>Phase 3 (Ausf\u00fchrung):<\/strong> AI bearbeitet eine Aufgabe pro Sitzung. Schlie\u00dfen Sie die Aufgabe ab, \u00fcberpr\u00fcfen Sie, ob sie funktioniert hat, dokumentieren Sie, was getan wurde, und beenden Sie die Sitzung. Neue Sitzung. Wiederholen Sie.<\/li>\n<\/ul>\n<p>Die wichtigste Einschr\u00e4nkung: Aufgaben m\u00fcssen einen klar messbaren Abschluss haben. Dieser Ansatz eignet sich schlecht f\u00fcr mehrdeutige Anforderungen, Ermessensentscheidungen oder Sondierungsarbeiten ohne klare Endpunkte.<\/p>\n<h3>Ergebnisse von Early Adopters<\/h3>\n<p>Die Zahlen aus der Praxis sind beeindruckend, auch wenn sie eher aus Selbstversuchen-reports als aus kontrollierten Studien stammen.<\/p>\n<p>Ein Berater lieferte ein Projekt, das $50.000 gekostet h\u00e4tte, f\u00fcr weniger als $300 an KI-Kosten - und f\u00fchrte \u00fcber Nacht automatisierte Sitzungen durch. Ein Startup-Team lieferte \u00fcber Nacht sechs wichtige Ergebnisse mit funktionierenden Ausgaben, Verifizierung und Dokumentation. Ein Praktiker entwickelte ein komplettes Produkt in drei Monaten mit automatisierten Sitzungen.<\/p>\n<p>Typische Kosten liegen zwischen $50-100 f\u00fcr umfangreiche Projekte mit mehr als 50 Arbeitssitzungen. Jede Sitzung dauert 30-45 Minuten vor dem Radfahren.<\/p>\n<p>Anthropic hat diesen Ansatz im Dezember 2025 formalisiert und die offizielle Unterst\u00fctzung freigegeben. Das Muster wurde von einer Umgehungsl\u00f6sung zu einer anerkannten Methode.<\/p>\n<h3>Die Begrenzung<\/h3>\n<p>Dieser Ansatz ist deterministisch in einer unvorhersehbaren Welt. Wie ein Praktiker es ausdr\u00fcckt: \u201cEs ist besser, vorhersehbar zu scheitern als unvorhersehbar erfolgreich zu sein.\u201d<\/p>\n<p>Das ist sowohl die St\u00e4rke als auch die Einschr\u00e4nkung. Der Radsport funktioniert, wenn Sie den Erfolg klar definieren k\u00f6nnen. Es ist schwierig, wenn Erfolg subjektiv ist, wenn Qualit\u00e4t implizit ist und wenn die \u201crichtige\u201d Antwort nur durch menschliches Urteilsverm\u00f6gen erkannt werden kann.<\/p>\n<h2>Ansatz 2: Selektives Ged\u00e4chtnis<\/h2>\n<p>Beim Fresh-Start-Radfahren wird alles zwischen den Sitzungen weggeworfen. Jeder Zyklus beginnt v\u00f6llig neu. Was w\u00e4re, wenn Sie die wichtigen Teile selektiv bewahren k\u00f6nnten?<\/p>\n<p>Das selektive Ged\u00e4chtnis verfolgt einen anderen Ansatz: Es extrahiert und speichert die wesentlichen Informationen und verwirft den Rest. Anstatt ganz von vorne anzufangen, erbt die KI eine kuratierte Zusammenfassung dessen, was wichtig ist.<\/p>\n<h3>Das Zwei-Rollen-Muster<\/h3>\n<p>Eine g\u00e4ngige Implementierung verwendet zwei spezialisierte KI-Rollen:<\/p>\n<ul>\n<li><strong>Rolle einrichten:<\/strong> L\u00e4uft nur zu Beginn. Stellt den Kontext her, identifiziert die wichtigsten Informationen und erstellt erste Referenzdokumente.<\/li>\n<li><strong>Arbeitsrolle:<\/strong> Verwaltet alle nachfolgenden Sitzungen. Bewahrt die Kontinuit\u00e4t durch drei Artefakte: eine Fortschrittsanzeige, die abgeschlossene und noch ausstehende Arbeiten anzeigt, eine Checkliste mit den als erledigt oder verbleibend markierten Punkten und eine \u00c4nderungshistorie, die zeigt, was ge\u00e4ndert wurde und warum.<\/li>\n<\/ul>\n<p>Der Beginn der Sitzung ist eindeutig: Best\u00e4tigen Sie den aktuellen Stand, pr\u00fcfen Sie die Fortschrittsdokumente, w\u00e4hlen Sie die verbleibende Arbeit mit der h\u00f6chsten Priorit\u00e4t aus, \u00fcberpr\u00fcfen Sie die Ausgangssituation vor der neuen Arbeit.<\/p>\n<p>Der Unterschied zum Neustart: die Kompressionsstufe. Die Arbeitsrolle erbt eine kuratierte Zusammenfassung des relevanten Kontexts. Untersuchungen haben ergeben, dass dieser Ansatz es der KI erm\u00f6glicht, lange Aufgabensequenzen mit nur 16% der Informationen zu erledigen, die sie sonst ben\u00f6tigen w\u00fcrde. Eine Reduzierung des Overheads um 84%.<\/p>\n<h3>Fortgeschrittenes Ged\u00e4chtnis: Bewahrung von Beziehungen<\/h3>\n<p>Der Stand der Technik beim selektiven Ged\u00e4chtnis bewahrt nicht nur Fakten, sondern auch Beziehungen.<\/p>\n<p>Denken Sie daran, wie sich Menschen an Projekte erinnern. Wir erinnern uns nicht nur an einzelne Fakten. Wir erinnern uns daran, dass diese Entscheidung zu dieser Konsequenz f\u00fchrte, dass diese Person diese Verantwortung tr\u00e4gt, dass dieses Dokument mit dieser Anforderung zusammenh\u00e4ngt. Die Zusammenh\u00e4nge sind genauso wichtig wie der Inhalt.<\/p>\n<p>Fortschrittliche KI-Ged\u00e4chtnissysteme erfassen jetzt diese Beziehungen. Beim Speichern von Informationen extrahieren sie nicht nur, was passiert ist, sondern auch, wer daran beteiligt war, was damit zusammenhing und warum es wichtig war. Wenn sie Informationen abrufen, k\u00f6nnen sie den Kontext rekonstruieren, indem sie diesen Beziehungsstr\u00e4ngen folgen.<\/p>\n<p>Leistungskennzahlen aus diesen Systemen: 26% Verbesserung der Qualit\u00e4tsbewertungen. 90%+ Reduzierung des Informations-Overheads unter Beibehaltung der Koh\u00e4renz. Signifikant bessere Handhabung von Aufgaben, die sich \u00fcber mehrere Sitzungen erstrecken.<\/p>\n<h3>Der Kompromiss<\/h3>\n<p>Selektiver Speicher erh\u00f6ht die Komplexit\u00e4t. Sie brauchen eine Infrastruktur f\u00fcr die Speicherung und den Abruf. Sie m\u00fcssen entscheiden, was Sie behalten und was Sie verwerfen wollen. Sie m\u00fcssen darauf vertrauen, dass die Komprimierung das Wesentliche bewahrt.<\/p>\n<p>Dies ist kein gel\u00f6stes Problem. Speichersysteme k\u00f6nnen wichtige Details verlieren. Die Komprimierung kann zu subtilen Verzerrungen f\u00fchren. Die KI kann den falschen Kontext zur falschen Zeit abrufen. Die Reduzierung des 84% klingt beeindruckend, bis der 16%, den Sie behalten haben, etwas Wesentliches vermissen l\u00e4sst.<\/p>\n<h2>Ansatz 3: Team-Koordination<\/h2>\n<p>Was, wenn die Antwort nicht eine KI mit besserem Ged\u00e4chtnis ist, sondern viele KI-Systeme mit klaren Rollen?<\/p>\n<p>Bei der Teamkoordination wird komplexe Arbeit in spezialisierte Rollen aufgeteilt, die von einem zentralen Manager koordiniert werden. Jede Rolle hat einen begrenzten Aufgabenbereich, einen begrenzten Informationsbedarf und eine spezifische Aufgabe. Der Manager beh\u00e4lt das Gesamtbild im Auge und leitet nur relevante Informationen an die einzelnen Mitarbeiter weiter.<\/p>\n<h3>Das Muster hinter den Kulissen<\/h3>\n<p>F\u00fchrende KI-Unternehmen verwenden dies intern. Die Struktur:<\/p>\n<p><strong>Koordinator:<\/strong> Ein leistungsf\u00e4higes KI-System, das f\u00fcr die Analyse von Anfragen, die Planung der Vorgehensweise, die Pflege des Speichers und die Leitung von Spezialisten zust\u00e4ndig ist.<\/p>\n<p><strong>Fachleute:<\/strong> Fokussierte KI-Systeme, die parallel f\u00fcr bestimmte Aufgaben arbeiten.<\/p>\n<p>Das Ergebnis: Teambasierte Systeme \u00fcbertreffen einzelne KI-Systeme bei komplexen Forschungsaufgaben um 90%. Das ist keine marginale Verbesserung. Eine nahezu Verdopplung der Leistung.<\/p>\n<p>Die wichtigste Erkenntnis: Das Informationsmanagement erkl\u00e4rt 80% der Leistungsunterschiede bei teambasierter KI. Die spezifischen Tools und KI-Modelle sind weniger wichtig als die Art und Weise, wie Informationen zwischen den Rollen flie\u00dfen.<\/p>\n<h3>Zwei Koordinationsmuster<\/h3>\n<p><strong>\u00dcbergabe-Muster:<\/strong> Ein KI-System \u00fcbergibt mitten in einer Aufgabe die Kontrolle an ein anderes. Jedes System wei\u00df \u00fcber das andere Bescheid und entscheidet, wann es die Kontrolle abgibt. Der Arbeitsablauf wird fortgesetzt, aber die Verantwortung geht \u00fcber. Funktioniert gut bei sequentiellen, abgestuften Arbeitsabl\u00e4ufen.<\/p>\n<p><strong>Manager-Muster:<\/strong> Ein zentraler Koordinator weist die Arbeit den Spezialisten zu und sammelt die Ergebnisse. Die Spezialisten liefern die Ergebnisse zur\u00fcck; der Koordinator beh\u00e4lt die Kontrolle und trifft die Entscheidungen. Keine \u00dcbergabe des Hauptthreads. Eignet sich gut f\u00fcr parallele Verarbeitung und Ergebnissynthese.<\/p>\n<p>Die Wahl h\u00e4ngt von Ihrem Arbeitsablauf ab. \u00dcbergaben funktionieren gut, wenn sich die Aufgaben auf nat\u00fcrliche Weise in Phasen aufteilen. Manager-Muster eignen sich gut, wenn Sie eine parallele Verarbeitung mit zentraler Entscheidungsfindung ben\u00f6tigen.<\/p>\n<h3>Standardisierung der Industrie<\/h3>\n<p>Im Jahr 2025 hat die Branche standardisiert, wie KI-Systeme miteinander und mit externen Ressourcen verbunden werden. Stellen Sie sich das wie die Standardisierung von Steckdosen vor - die Produkte verschiedener Hersteller k\u00f6nnen jetzt zusammenarbeiten.<\/p>\n<p>Ein Standard definiert, wie KI mit Informationsquellen und Tools verbunden wird. Ein anderer definiert, wie KI-Systeme miteinander kommunizieren. Zusammen erm\u00f6glichen sie Bausteine, die in verschiedenen Konfigurationen zusammengesetzt werden k\u00f6nnen.<\/p>\n<p>Das ist wichtig, weil es Modularit\u00e4t erm\u00f6glicht. Ein von einem Team entwickelter Arbeitsablauf kann Komponenten enthalten, die von einem anderen Team entwickelt wurden. Speichersysteme werden austauschbar. Informationsquellen werden auffindbar. Das \u201cKI-\u00d6kosystem\u201d ist kein Marketing - es ist eine technische Realit\u00e4t, die diese Standards erm\u00f6glichen.<\/p>\n<h3>Die Gemeinkosten<\/h3>\n<p>Teambasierte KI verbraucht etwa 15x mehr Ressourcen als KI mit Einzelinteraktion. Das sind die Kosten f\u00fcr die Koordination. Bei einfachen Aufgaben \u00fcberwiegt dieser Aufwand jeden Nutzen. Bei komplexen Aufgaben rechtfertigt die verbesserte Zuverl\u00e4ssigkeit die Kosten.<\/p>\n<p>Auch die Fehlerm\u00f6glichkeiten sind komplexer. Ein schlechtes \u00dcbergabekonzept f\u00fchrte bei einem E-Commerce-Unternehmen zu 40% Kundenabbr\u00fcchen, als KI-\u00dcberg\u00e4nge die Benutzer verwirrten. Kaskadenartige Ausf\u00e4lle k\u00f6nnen sich in KI-Netzwerken ausbreiten. In einer Branchenanalyse aus dem Jahr 2025 wurden 14 eindeutige Fehlermuster in den Bereichen Systemdesign, Koordinationspannen und Qualit\u00e4tspr\u00fcfung identifiziert.<\/p>\n<h2>Die Wahl des richtigen Ansatzes<\/h2>\n<p>Hier ist, wie ich \u00fcber diese Optionen denke:<\/p>\n<ul>\n<li><strong>Frisch gestarteter Radsport<\/strong> funktioniert, wenn die Aufgaben eindeutig messbar abgeschlossen sind, Sie vorhersehbare, schrittweise Fortschritte tolerieren k\u00f6nnen, der Fortschritt vollst\u00e4ndig in Dokumenten und Aufzeichnungen festgehalten werden kann und Sie Einfachheit der Raffinesse vorziehen.<\/li>\n<li><strong>Selektives Ged\u00e4chtnis<\/strong> funktioniert, wenn Aufgaben die Erhaltung von Beziehungen \u00fcber mehrere Sitzungen hinweg erfordern, Sie \u00fcber eine Infrastruktur f\u00fcr die Speicherung und den Abruf verf\u00fcgen, Effizienz im gro\u00dfen Ma\u00dfstab wichtig ist und Sie in den Aufbau von Komprimierungssystemen investieren k\u00f6nnen.<\/li>\n<li><strong>Team-Koordination<\/strong> funktioniert, wenn Aufgaben auf nat\u00fcrliche Weise in spezialisierte Teilaufgaben zerfallen, Sie parallele Verarbeitung ben\u00f6tigen, der Koordinationsaufwand (15x Ressourcen) akzeptabel ist und Sie komplexere Fehlermodi handhaben k\u00f6nnen.<\/li>\n<\/ul>\n<p>Die meisten Produktionssysteme werden Elemente aus allen drei Bereichen kombinieren. Ein teambasiertes System, bei dem jeder Spezialist den Fresh-Start-Zyklus verwendet. Ein Koordinator mit Speichererweiterung, der zustandslose Arbeiter anleitet. Die Ans\u00e4tze sind komplement\u00e4r, nicht exklusiv.<\/p>\n<p>Der gemeinsame Nenner: Alle drei Ans\u00e4tze externalisieren Informationen, die die KI intern nicht zuverl\u00e4ssig verwalten kann. Sie unterscheiden sich darin, wie viel sie externalisieren und wie sie die Abfrage verwalten.<\/p>\n<p><em>Unter <a href=\"https:\/\/www.artefact.com\/de\/blog\/long-run-ai-agents-part-3-what-this-actually-means-for-organizations\/\">Teil 3<\/a>, werden wir untersuchen, was langfristige KI f\u00fcr Unternehmen bedeutet: wie sich die Arbeit ver\u00e4ndert, welche Governance erforderlich ist und wo die realistischen Chancen im Jahr 2026 liegen.<\/em><\/p>\n<p>&nbsp;<\/p>\n<p><strong>Referenzen<\/strong><\/p>\n<p><span style=\"text-decoration: underline;\">Forschungspapiere<\/span><\/p>\n<ul>\n<li>Aufbau produktionsreifer KI mit skalierbarem Langzeitspeicher - <a href=\"http:\/\/arxiv.org\/abs\/2504.19413\" target=\"_blank\" rel=\"noopener\">arxiv.org\/abs\/2504.19413<\/a><\/li>\n<li>Multi-Graph basierte Speicherarchitektur f\u00fcr KI - <a href=\"http:\/\/arxiv.org\/abs\/2601.03236\" target=\"_blank\" rel=\"noopener\">arxiv.org\/abs\/2601.03236<\/a><\/li>\n<li>KI in der Produktion messen - <a href=\"http:\/\/arxiv.org\/abs\/2512.04123\" target=\"_blank\" rel=\"noopener\">arxiv.org\/abs\/2512.04123<\/a><\/li>\n<\/ul>\n<p><span style=\"text-decoration: underline;\">Branchenberichte &amp; Whitepapers<\/span><\/p>\n<ul>\n<li>Fehlermodi in KI-Systemen - Microsoft<\/li>\n<li>Lektionen aus dem Jahr 2025 \u00fcber KI und Vertrauen - Google Cloud<\/li>\n<li>Stand der KI-Technik - LangChain<\/li>\n<li>Benchmark vs. Bewertung in der realen Welt - METR<\/li>\n<\/ul>\n<p><span style=\"text-decoration: underline;\">Technische Dokumentation<\/span><\/p>\n<ul>\n<li>Wie wir unser Multi-Agenten-Forschungssystem aufgebaut haben - Anthropic<\/li>\n<li>Spezifikation des Modellkontextprotokolls - modelcontextprotocol.io<\/li>\n<li>Fresh-Start Cycling Dokumentation (\u201cRalph Wiggum\u201d) - Geoffrey Huntley (<a href=\"http:\/\/ghuntley.com\/ralph\/\" target=\"_blank\" rel=\"noopener\">ghuntley.com\/ralph\/<\/a>)<\/li>\n<\/ul>","protected":false},"excerpt":{"rendered":"<p>Ende 2025 ging eine Technik mit dem absurden Namen \"Ralph Wiggum\" unter Praktikern viral. Der Name stammt von einer Simpsons-Figur \u2013 bewusst albern, denn die Kernidee ist fast schon peinlich einfach.<\/p>","protected":false},"featured_media":1086606,"parent":0,"template":"","meta":{"_acf_changed":false,"ep_exclude_from_search":false},"blog-category":[2995],"blog-language":[2991],"class_list":["post-1083984","blog","type-blog","status-publish","has-post-thumbnail","hentry","blog-category-ai-technology","blog-language-en"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/blog\/1083984","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/blog"}],"about":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/types\/blog"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/media\/1086606"}],"wp:attachment":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/media?parent=1083984"}],"wp:term":[{"taxonomy":"blog-category","embeddable":true,"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/blog-category?post=1083984"},{"taxonomy":"blog-language","embeddable":true,"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/blog-language?post=1083984"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}