AI Agents Aren’t Ready for Consumer-Facing Work – But They Can Excel at Internal Processes.

Lesen Sie den Artikel auf

Auch die Akzeptanz bei den Verbrauchern ist noch relativ gering. Trotz der Verwendung von Worten wie “Revolution”," data zeigt dass die meisten Nutzer eher wöchentlich als täglich zugreifen, anders als bei der häufigeren Nutzung von sozialen Netzwerken oder Plattformen wie Google. Das deutet darauf hin, dass die KI-Generation noch nicht zu einer echten Verbrauchergewohnheit geworden ist. Die Menschen nutzen sie gelegentlich - manchmal sogar intensiv - aber sie ist noch nicht zu einem festen Bestandteil des täglichen Lebens geworden. Mit anderen Worten: Der Hype ist der Realität noch voraus.

Trotz dieser reports glauben wir, dass die Gen-KI eine grundlegende Veränderung in der gleichen Größenordnung wie das Internet oder das Smartphone darstellt. Das Internet hat uns etwa zwei Jahrzehnte der Innovation und des Aufbaus von Unternehmen beschert. Die Smartphone-Revolution sorgte 15 Jahre lang für ein Wachstum, das durch mobile Apps angeheizt wurde. Wir glauben, dass die Gen-KI eine ähnliche Ära des Wandels einleiten wird - vielleicht ein Jahrzehnt oder mehr der neuen Wertschöpfung.

Ein solches Muster ist bei neuen Technologien üblich (übermäßiger Optimismus, gefolgt von Ernüchterung und dann echter Wertschöpfung, oft artikuliert durch der Gartner-Hype-Zyklus). Unserer Ansicht nach übertreiben viele der führenden KI-Befürworter, wenn sie kühne Behauptungen aufstellen, dass ganze Bereiche der Wirtschaft in Kürze durch KI ersetzt werden. Das liegt daran, dass echte, funktionierende KI in etablierten Unternehmen harte Arbeit ist: Sie erfordert eine relativ saubere data, Prozessabbildung und tiefgreifende Experimente - und selbst dann ist oft ein Mensch in der Schleife erforderlich. Wir sehen jedoch echte Fortschritte hinter den Kulissen, die darauf hindeuten, dass der Einsatz von Multi-Agenten-Systemen zur Automatisierung und Ersetzung sich wiederholender Aufgaben zu einem längeren, grundlegenderen Anstieg der Produktivität führen kann.

Wir sind der Meinung, dass Führungskräfte nicht versuchen sollten, zu erraten, was in 10 Jahren passieren wird. Stattdessen sollten sie sich fragen, was sie in den nächsten zwei Jahren realistischerweise erreichen können. Ausgehend von den Projekten, die wir seit Ende 2024 durchgeführt haben, erweist sich die agentenbasierte KI als echter Game Changer (zumindest kurzfristig), der den Unternehmen einen echten Mehrwert bietet. Die Realität ist auch, dass die finanziellen Gewinne pro Projekt gut sind, aber keines davon ist atemberaubend. Diese inkrementellen Gewinne sind vergleichbar mit Lean, ein Vergleich, den Microsoft CEO Satya Nadella hat auch die.

Auf der Grundlage unserer Arbeit an einem Portfolio von Projekten, die erfolgreich agentenbasierte KI-Systeme implementieren, haben wir festgestellt, dass es für den Erfolg mit dieser Technologie erforderlich ist, den Hype zu durchbrechen, zu verstehen, was die Technologie leisten kann, und diese Fähigkeit mit klaren Wertschöpfungsmöglichkeiten abzugleichen. Außerdem ist ein praktischer Ansatz zum Experimentieren und Lernen bei der Implementierung von Multi-Agenten-Systemen erforderlich.

Der Aufstieg des agentenbasierten Workflow-Paradigmas

In den letzten Jahren hat sich die Reife der KI-Technologie in mindestens drei verschiedenen Phasen rasant weiterentwickelt:

Prompting (2022): Der frühe Enthusiasmus konzentrierte sich auf “Power Prompts”. In Proofs of Concept (POCs) schienen die Prompts zu funktionieren. Aber in der Produktion ließ die Zuverlässigkeit schnell nach. Geschäftsprozesse erfordern in der Regel eine Genauigkeit von 95-99%. Ausgehend von unserer Erfahrung mit mehr als 50 Fällen schätzen wir, dass die Eingabeaufforderung allein selten über 70% hinausging.
Retrieval-Augmented Generation (RAG, 2023): RAG verbesserte die Stabilität durch die Verankerung von KI-Ausgaben in Wissensdatenbanken. Auch hier sahen die POCs vielversprechend aus, aber die Komplexität der Produktion offenbarte oft Schwächen, die zu einer inakzeptabel niedrigen Genauigkeit führten.
Agentische Systeme (2024 bis heute): Die jüngsten Fortschritte betreffen Netzwerke von kleinen, spezialisierten Agenten. Einige leiten Fragen weiter. Andere führen eng definierte Aufgaben aus. Wieder andere überprüfen und korrigieren Ausgaben. Entscheidend ist, dass sinkende Token-Kosten die Kaskadierung von Multi-Agenten-Systemen jetzt kommerziell rentabel machen. Dieser mehrschichtige Aufbau verbessert die Zuverlässigkeit erheblich.

In diesem Herbst gab es eine Explosion von kommerziellen Initiativen im Bereich der Agententechnik. OpenAI startete Partnerschaften mit Stripe und Shopify. Google kündigte sein Agent Payment Protocol an, die den Kauf- und Transaktionsprozess automatisiert. Auch wenn die Unternehmen versucht sein mögen, dem Beispiel der Tech-Giganten zu folgen, ist dies möglicherweise nicht der Ort, an dem die erste Welle nachhaltiger Werte entstehen wird. In einem aktuelle Bain-Umfrage unter Verbrauchern, 76% gaben an, dass sie sich nicht wohl dabei fühlen würden, Agentensysteme für Einkäufe zu nutzen - die meisten nannten Bedenken bezüglich Sicherheit und Datenschutz als Grund für ihre Zurückhaltung.

Kontexte mit Kundenkontakt passen schlecht zu den aktuellen Fähigkeiten von KI-Agenten. Sie sind chaotisch und unvorhersehbar. Die Eingaben sind unstrukturiert, der Ton und der Kontext ändern sich ständig, und Regulierungsbehörden und Verbraucher haben wenig Toleranz für Halluzinationen oder Fehler. Multi-Agenten-Systeme kann ein hohes Maß an Genauigkeit erreichen, aber dazu muss jeder einzelne Agent wie ein Kleinkind behandelt werden. Sie würden ein Kleinkind nicht bitten, den Tisch zu decken. Aber wenn Sie die Aufgabe aufteilen und es Schritt für Schritt anleiten - “zuerst einen Teller abstellen”, “jetzt die Gabeln dazulegen”, “als nächstes die Gläser” - kann das Kleinkind einen sinnvollen Beitrag leisten. Entscheidend ist auch, dass die Umgebung kontrolliert wird: keine lärmenden Geschwister, keine ablenkenden Haustiere und nur ein Elternteil, der Anweisungen gibt. Aber durch die Entwicklung von Multi-Agenten-Systemen, die so strukturiert sind, wie Sie einem Kleinkind Anweisungen geben - die Aufgabe aufteilen, eine Aufgabe nach der anderen geben, die Aufgaben auf ihre Genauigkeit überprüfen - bauen wir bemerkenswert genaue Systeme.

Vor allem sind diese Systeme oft für Backend-Prozesse gedacht, bei denen Perfektion nicht unbedingt erforderlich ist, weil Sie einen Menschen in der Schleife haben. Im Gegensatz dazu können Front-End-Experimente zwar inspirierend sein, aber es ist unwahrscheinlich, dass sie der erste Bereich sind, in dem ein echter Unternehmenswert geschaffen wird. Backend- und Betriebsprozesse sind ein fruchtbarer Boden, weil sie strukturiert und repetitiv sind - viel besser geeignet für die Automatisierung von Arbeitsabläufen durch Agenten. Eng umrissene Aufgaben, klar definierte Umgebungen und strukturierte Eingaben können Projekte hervorbringen, die einen sinnvollen Beitrag leisten.

Aufbau agentischer Systeme auf Unternehmensebene

Im Unternehmensmaßstab ist die Entwicklung dieser Systeme konzeptionell einfach, aber operativ anspruchsvoll. Als allgemeiner Rahmen für den Aufbau von Multiagentensystemen wird 1) eine Aufgabe an einen Router-Agenten wie Google ADK gesendet, der, wie ein Elternteil, der ein Kleinkind anweist, die Aufgabe in Teilaufgaben aufteilt; 2) die Teilaufgaben werden dann von einzelnen Aufgabenagenten erledigt, die einen kleineren Teil der Aufgabe erledigen, wie der Elternteil, der einem Kleinkind sagt, es solle die Gläser auf den Tisch stellen und einem anderen, es solle die Gabeln aufstellen; wonach 3) die Ergebnisse dieser Teilaufgaben von einem Validierungsagenten überprüft werden; und 4) wenn ein Fehler entdeckt wird, empfiehlt ein Verbesserungsagent eine Anpassung.

Ein schnell wachsendes Ökosystem von Tools, Methoden und Diensten unterstützt diesen Ansatz, und diese sind für Nicht-Kernprozesse hervorragend geeignet. Wenn Sie jedoch in den Kernbereich vordringen - wo data-Integrität und Kontrolle über Halluzinationen unerlässlich sind - brauchen Sie maßgeschneiderte Agenten, eine tiefere Integration in die Unternehmenssysteme und eine bessere Kontrolle und Leitplanken.

Ein Fallbeispiel: Den Außendienst neu erfinden

Nehmen wir zur Veranschaulichung ein Projekt, das wir mit einem großen europäischen Internetanbieter durchgeführt haben. Unser Ziel war es, sowohl die Lösungszeit als auch die Kosten für die Behebung von Serviceanfragen zu senken. Die meisten Menschen haben schon einmal wegen einer unterbrochenen Verbindung beim Helpdesk angerufen, Informationen mehrfach wiederholt und schließlich auf einen Techniker gewartet. Was hinter den Kulissen passiert (oder nicht passiert), ist aufschlussreich: Techniker kommen oft mit unvollständigem Kontext an und sind gezwungen, das Problem von Grund auf zu lösen. Dies führt zu langen Ausfallzeiten - manchmal über einen Monat - und Tausenden von verschwendeten Arbeitsstunden.

Wir beschlossen, klein anzufangen. Wir konzentrierten uns auf den Aufbau eines Systems, das den Technikern helfen sollte, ihre Aufgaben schneller und besser zu erledigen - ein Helfer im Prozess, kein eigenständiger Agent. Im Rahmen dieser Bemühungen integrierten wir data aus mehr als 15 Informationssystemen, so dass die Techniker einen Überblick über die gemeldeten Fehler und die bereits ausprobierten Lösungen erhielten. So erhielten sie einen Überblick über die Aufgabe - z. B. die Fehlerbehebung bei der Verbindung eines Kunden -, den sie auf dem Weg zum Einsatz lesen oder anhören konnten. Auf diese Weise konnten sie sofort nach ihrer Ankunft mit der Lösung des Problems beginnen, was Zeit sparte, die oft mit der Einarbeitung in das Problem verschwendet wurde.

Als Nächstes entwickelten wir eine Funktion, die Empfehlungen für die nächstbeste Aktion zur Lösung des Problems generierte. Eine weitere Funktion umfasste eine Konversationsschnittstelle, die es dem Techniker ermöglichte, die zugrunde liegenden IT-Systeme des Internetunternehmens in natürlicher Sprache abzufragen, um die Grundursachen zu finden. Schließlich automatisierten wir viele einfache und sich wiederholende Aktionen: z.B. die Korrektur von CRM-Datensätzen, wenn ein falscher Haushalt verknüpft war, oder das Auslösen von Netzwerk-Resets, wenn ein Schalter in der zentralen Nachbarschaftsanschlussdose nicht funktionierte. Dadurch sparten die Techniker immens viel Zeit, denn sie mussten nicht mehr das interne Callcenter anrufen, um mit kleinen Änderungen die Fehler zu beheben.

Im Laufe von acht Monaten arbeiteten wir iterativ - wir bildeten Prozesse ab, behoben Schwachstellen und fügten Schritt für Schritt neue Funktionen hinzu, wobei wir wöchentlich Feedback von Technikern erhielten, die die Tablet-basierte Lösung testeten.

Die Ergebnisse:

60% Verkürzung der Auflösungszeit
Jährlich mehr als eine Million Euro eingespart
Signifikante Verbesserung der Kundenzufriedenheit Net Promoter Score

Auf der Grundlage dieser Ergebnisse wollte der Kunde, dass es auf sieben weitere Regionen ausgeweitet wird. Dies erforderte eine ganze Menge mehr Arbeit: Die Methodik und einige Agentenkomponenten waren wiederverwendbar, aber jede Region hatte andere IT-Systeme. Jede Ausweitung erforderte neue Integrationen und data-Zuordnungen. Die Ausweitung auf jede der sieben Regionen erforderte die Hälfte des ursprünglichen Aufwands pro Region.

Die Herausforderungen bei der Implementierung von Multi-Agenten-Systemen

Wie oben dargestellt, können Multiagentensysteme erfolgreich einen echten Mehrwert schaffen, aber zu wenige Menschen sprechen über die tatsächliche Arbeit bei ihrer Implementierung. Was waren die Realitäten und Hindernisse, mit denen wir konfrontiert waren?

Schnelles Testen vs. Hochskalieren.

Haben wir es von Anfang an in einer schönen, skalierbaren Architektur aufgebaut? So gerne wir das auch behaupten würden, es wäre unmöglich gewesen. Genauso wie Innovatoren iterativ die Passung zwischen Produkt und Markt entdecken, haben sich die Anwendungsfälle des Multi-Agenten-Systems und die Lösung iterativ entwickelt, als wir einen Zyklus von schnellen Experimenten durchführten. Daneben entwickelten sich auch die Technologie, die Methodik und die Dienstleistungen zum Aufbau dieser Systeme rasch weiter.

Wir haben nicht mit dem kompletten System begonnen. Stattdessen begannen wir mit einem LLM plus RAG als zentralem Teil, um im Grunde den ersten Anwendungsfall zu lösen. Im Laufe der Tests stellten wir fest, dass wir das System in kleinere Agenten aufteilen mussten, die speziellere Aufgaben erledigten, um die Zuverlässigkeit zu erhöhen; langsam entwickelte sich dies zu einem vollständig agentenbasierten System. Schließlich entwickelten wir ein hochzuverlässiges, funktionierendes System, das einen Mehrwert bietet. Mit diesem Wissen und den Ergebnissen, die wir jetzt haben, bauen wir es zu einer Architektur um, die viel robuster für die Skalierung anderer Teile des Unternehmens ist und leichter gewartet werden kann.

Problemzonen vs. Grundursachen.

Als Faustregel haben wir festgestellt, dass Führungskräfte und mittlere Manager in etwa wissen, welche Prozesse viel Zeit oder Mühe kosten, aber sie haben eine schlecht informierte Meinung darüber, wo die Komplexität und die Chancen liegen. Nur die Mitarbeiter wissen das. Daraus ergibt sich, dass Sie zwei Dinge tun müssen, bevor Sie wirklich mit dem Aufbau beginnen können: 1) Sie müssen sich ausreichend Zeit nehmen, um die Probleme aus der Sicht des Managers zu verstehen, und 2) Sie müssen mit den Mitarbeitern darüber sprechen, was sie als Ursache für ein bestimmtes Problem ansehen.

Die Manager wiesen uns zum Beispiel auf Teile des Prozesses hin, in denen Zeit oder Ressourcen verschwendet wurden (z.B. im Shared Service Center), und sagten uns, wir sollten uns darum kümmern, die richtigen “Wissensobjekte” für den Bediener zu finden, um ein Problem schneller zu lösen. Als wir jedoch begannen, direkt mit den Operatoren zu arbeiten, stellten wir fest, dass die Hälfte der Operatoren die “Wissensobjekte” innerhalb von 10 Sekunden fand, während die andere Hälfte Minuten brauchte, um die gleichen Informationen zu finden, weil sie nicht gut darin waren, das System zu durchsuchen. Das ist kein Problem, das die agentenbasierte KI gut lösen kann - es ist eine Frage des Trainings. Wir entdeckten aber auch, dass Führungskräfte und Manager völlig übersehen hatten, dass die Agenten etwa 50% ihrer Zeit damit verbringen, das CRM nach Kundenanrufen auszufüllen. Dies ist ein gutes Problem für einen Agenten, der den Anruf transkribieren und alle Informationen in die richtigen Felder eintragen kann, was den Prozess erheblich beschleunigt und die data Qualität verbessert. Der Mitarbeiter muss nur noch prüfen und auf OK drücken.

Nicht die IT-Systeme bremsen Sie aus, sondern die Menschen.

Der aufwändigste und komplexeste Teil unserer Arbeit bestand darin, die richtigen Managementgespräche zu führen, Stakeholder zu überzeugen und Abhängigkeiten zu identifizieren und zu lösen, die durch unsere Arbeit entstanden sind. Die Integration mit einem Dutzend IT-Systemen, damit die Lösung funktioniert, ist aus technologischer Sicht komplex, aber die eigentliche Herausforderung besteht darin, dass alle diese Systeme ihre eigenen Entwicklungsteams mit unterschiedlichen Zeitplänen, Prioritäten und Roadmaps haben. Die Bereitstellung von API-Endpunkten und das Testen dieser Endpunkte kann zwei Wochen in Anspruch nehmen. Die Einarbeitung in die jeweiligen Roadmaps dieser Systeme dauerte viel, viel länger. Die meisten Teams, mit denen wir zusammenarbeiteten, schoben diese Arbeit mehrere Monate lang auf und behaupteten (aus ihrer Sicht wahrscheinlich zu Recht), sie hätten wichtigere Aufgaben, die Vorrang hätten.

Models können und werden halluzinieren.

Agenten sind immer noch recht instabil und können halluzinieren, was starke Leitplanken und Kontrollen in Form von LLM-as-a-judge (dem Validierungsagenten) erforderlich macht. Die Eingabeaufforderung des Agenten muss stark genug und dennoch leicht genug sein, damit der Agent seine Aufgaben ordnungsgemäß ausführen kann. Dies erfordert Fingerspitzengefühl, Zeit und data wissenschaftliches und data technisches Geschick, damit diese Agentensysteme so zuverlässig arbeiten, dass sie in Ihrem Unternehmen eingesetzt werden können. Mit anderen Worten: Gute Entwickler und Erfahrung in der Wirtschaft sind immer noch sehr wichtig.

Die neue Disziplin der agenturischen Transformation

Welche allgemeineren Lehren können wir aus diesem Fall ziehen? In vielerlei Hinsicht fühlt es sich so an, als hätten wir die Arbeit des Lean-Reengineering von Grund auf neu entdeckt. Der Unterschied besteht darin, dass die heutigen Tools wesentlich leistungsfähiger sind und nicht nur eine schrittweise Optimierung, sondern eine vollständige Neugestaltung von Prozessen ermöglichen, und das sogar abteilungsübergreifend.

Jenseits von data und KI-Fähigkeiten hängt der Erfolg von einer tiefgreifenden Prozesskenntnis ab - dem Verstehen des aktuellen Zustands, der Vorstellung des zukünftigen Zustands und der Umsetzung in kleine, umsetzbare Schritte. In diesem Sinne erleben wir die Rückkehr von “Lean Black Belts,”, aber dieses Mal werden sie von Gen-KI angetrieben.

Die Arbeit ist detailliert und methodisch, nicht glamourös. Sie müssen Schritt für Schritt vorgehen. Der Ansatz skaliert in der Methode, nicht in der Magie. Jedes neue Geschäftsfeld erfordert eine neue Analyse und individuelle Anpassung.

Völlig autonome Agenten sind noch weit entfernt. Im Moment ist es am effektivsten, wenn der Mensch in der Schleife bleibt - so ist der Bediener intelligenter, schneller und besser ausgerüstet.

Der Fortschritt ist zunächst schrittweise. Erst wenn die Kernsysteme miteinander verbunden sind und die Informationen reibungslos fließen, zeigen sich größere Effizienzgewinne.

Auch die Technologie entwickelt sich schneller weiter als die Projekte. Die Tools, die wir vor acht Monaten verwendet haben, sind bereits veraltet. Deshalb konzentrieren wir uns auf Anwendungsfälle, die sich innerhalb eines Jahres amortisieren - bevor sich die zugrunde liegende Technologie ändert.

Noch wichtiger ist, dass Unternehmen interne Fähigkeiten aufbauen - data-Ingenieure, data-Wissenschaftler, Gen-KI-UX-Designer und das, was manche jetzt als Kontext-Ingenieure oder Gen-KI-Black Belts bezeichnen: Menschen, die Prozesse zutiefst verstehen und die Transformation in realisierbare Schritte aufteilen können. Wenn Sie als Unternehmen diese Fähigkeiten aufbauen, können Sie neue agentenbasierte Workflows schneller entwickeln (wenn sich die Technologie weiterentwickelt), was ein echtes Unterscheidungsmerkmal gegenüber der Konkurrenz sein kann.

Auch wenn diese Initiativen schließlich in den normalen Geschäftsbetrieb integriert werden, ist es wichtig, sie mit einer starken Governance zu beginnen - einer, die technische und geschäftliche Perspektiven vereint. Dieses Gleichgewicht ist es, das aus Experimenten eine Transformation macht.

Das kommende Jahrzehnt

Der Hype um die Gen AI mag die Akzeptanz überholt haben, aber ihr Potenzial ist real. Wie die Internet- und Smartphone-Revolutionen vor ihr wird dieser Plattformwechsel Branchen umgestalten - nicht durch eine Störung über Nacht, sondern durch jahrelange, disziplinierte Neuerfindung.

Die Unternehmen, die gewinnen, werden nicht einfach nur Tools einführen, sondern die Fähigkeit entwickeln, sich durch diese Tools ständig neu zu erfinden.

Kontaktieren Sie uns

AI-Mitarbeiter sind nicht für den Kundenkontakt geeignet – können sich jedoch bei internen Prozessen hervorragend bewähren.

Autoren