Ook de acceptatie door consumenten blijft relatief laag. Ondanks het gebruik van woorden als 'revolutie'data dat de meeste gebruikers het systeem wekelijks gebruiken in plaats van dagelijks, in tegenstelling tot het frequentere gebruik van sociale netwerken of platforms zoals Google. Dit suggereert dat generatieve AI nog AI echte gewoonte AI geworden bij consumenten. Mensen gebruiken het af en toe – soms intensief – maar het is nog geen vast onderdeel van het dagelijks leven geworden. Met andere woorden: de hype loopt nog steeds voor op de realiteit.
Ondanks deze reports zijn wij van mening dat gen AI een fundamentele verschuiving AI die even groot is als die van het internet of de smartphone. Het internet heeft ons ongeveer twee decennia van innovatie en organisatie opgeleverd. De smartphonerevolutie heeft gezorgd voor 15 jaar groei, aangewakkerd door mobiele apps. Wij zijn van mening dat gen AI een soortgelijk tijdperk van transformatie AI inluiden – misschien wel een decennium of meer van nieuwe waardecreatie.
Een dergelijk patroon komt vaak voor bij nieuwe technologieën (het buitensporige optimisme gevolgd door desillusie en vervolgens echte waardecreatie, vaak verwoord inde hype cycle van Gartner). Naar onze mening overdrijven veel van de toonaangevende AI wanneer ze gewaagde uitspraken doen dat hele delen van de economie binnenkort door AI zullen worden vervangen. Dat komt omdat echte, functionele AI gevestigde bedrijven hard werken is: het vereist relatief schone data, procesmapping en diepgaande experimenten – en zelfs dan is vaak nog menselijke tussenkomst nodig. We zien echter echte vooruitgang achter de schermen, waarvan voorbeelden suggereren dat het gebruik van multi-agent systemen om repetitieve taken te automatiseren en te vervangen kan leiden tot een langere, meer fundamentele stijging van de productiviteit.
Wij zijn van mening dat leiders niet moeten proberen te raden wat er over tien jaar zal gebeuren. In plaats daarvan moeten ze zich afvragen wat ze realistisch gezien in de komende twee jaar kunnen bereiken. Op basis van de projecten die we sinds eind 2024 hebben uitgevoerd, AI agentische AI een echte gamechanger te zijn (in ieder geval op korte termijn), die bedrijven echte waarde biedt. De realiteit is ook dat de financiële opbrengsten per project goed zijn, maar geen van alle oogstrelend. Deze incrementele winsten zijn vergelijkbaar met Lean, een vergelijking dieook Microsoft-CEOSatya Nadella heeft gemaakt.
Op basis van ons werk aan een portfolio van projecten waarin agentische AI met succes worden geïmplementeerd, hebben we ontdekt dat succes met deze technologie vereist dat je door de hype heen kijkt, begrijpt wat de technologie kan doen en die mogelijkheden afstemt op duidelijke kansen om waarde te creëren. Het vereist ook een praktische benadering van het experimenteren met en leren van de implementatie van multi-agentensystemen.
De opkomst van het agentische workflowparadigma
De afgelopen jaren heeft de volwassenheid van AI zich snel ontwikkeld in ten minste drie verschillende fasen:
- Prompting (2022):Het vroege enthousiasme was vooral gericht op 'power prompts'. In proofs of concept (POC's) leken prompts te werken. Maar in de praktijk nam de betrouwbaarheid snel af. Bedrijfsprocessen vereisen doorgaans een nauwkeurigheid van 95-99%. Op basis van ervaring met meer dan 50 gevallen schatten we dat prompting alleen zelden meer dan 70% nauwkeurig was.
- Retrieval-Augmented Generation (RAG, 2023):RAG verbeterde de stabiliteit door AI generatieve AI te verankeren in kennisbanken. Ook hier leken de POC's veelbelovend, maar de complexiteit van de productie bracht vaak zwakke punten aan het licht die leidden tot een onaanvaardbaar lage nauwkeurigheid.
- Agentische systemen (2024 tot heden):De meest recente ontwikkelingen hebben betrekking op netwerken van kleine, gespecialiseerde agents. Sommige leiden vragen door. Andere voeren nauw omschreven taken uit. Weer andere controleren en corrigeren outputs. Cruciaal is dat de dalende tokenkosten nu cascading multi-agent systemen commercieel haalbaar maken. Dit gelaagde ontwerp verbetert de betrouwbaarheid aanzienlijk.
Dit najaar zag een explosie van commerciële initiatieven op het gebied van agentica. OpenAI gingpartnerschappen aanmet Stripe en Shopify.Google kondigde zijn Agent Payment Protocol aan, dat het aankoop- en transactieproces automatiseert. Hoewel bedrijven misschien geneigd zijn om het voorbeeld van de techgiganten te volgen, is dit misschien niet waar de eerste golf van duurzame waarde zal ontstaan. In eenrecent onderzoek van Bain onder consumenten gaf 76% aan dat ze zich niet op hun gemak zouden voelen bij het gebruik van agentische systemen voor aankopen. De meesten noemden bezorgdheid over veiligheid en privacy als reden voor hun terughoudendheid.
Klantgerichte contexten zijn niet geschikt voor de huidige mogelijkheden van AI . Ze zijn rommelig en onvoorspelbaar; de input is ongestructureerd, de toon en context veranderen voortdurend, en regelgevers en consumenten hebben weinig tolerantie voor hallucinaties of fouten. Multi-agent systemenkunneneen hoge mate van nauwkeurigheid bereiken, maar daarvoor moet elke individuele agent worden behandeld als een peuter. Je zou een peuter niet vragen om de tafel te dekken. Maar als je de taak opsplitst en hen stap voor stap begeleidt – "zet eerst een bord neer", "voeg nu de vorken toe", "daarna de glazen" – kan de peuter een zinvolle bijdrage leveren. Cruciaal is dat ook de omgeving onder controle moet worden gehouden: geen luidruchtige broers en zussen, geen afleidende huisdieren en slechts één ouder die instructies geeft. Maar door multi-agent systemen te ontwikkelen die zijn gestructureerd zoals je een peuter instructies geeft – de taak opsplitsen, taken één voor één aanreiken, de taken controleren op nauwkeurigheid – bouwen we opmerkelijk nauwkeurige systemen.
Het is opvallend dat deze systemen vaak worden gebruikt voor back-endprocessen, waar perfectie niet essentieel is omdat er mensen bij betrokken zijn. Front-endexperimenten kunnen daarentegen weliswaar inspirerend zijn, maar zullen waarschijnlijk niet het eerste gebied zijn waarop echte bedrijfswaarde wordt gecreëerd. Back-end- en operationele processen zijn een vruchtbare bodem omdat ze gestructureerd en repetitief zijn, en dus veel geschikter voor automatisering van agentische workflows. Straks omschreven taken, goed gedefinieerde omgevingen en gestructureerde inputs kunnen leiden tot projecten die een zinvolle bijdrage leveren.
Agentische systemen bouwen op bedrijfsniveau
Op bedrijfsniveau is het ontwerpen van deze systemen conceptueel eenvoudig, maar operationeel veeleisend. Als algemeen kader voor het bouwen van multi-agent systemen geldt het volgende: 1) een taak wordt naar een routeragent zoals Google ADK gestuurd, die, net als een ouder die een peuter instructies geeft, de taak in subtaken opsplitst; 2) worden de subtaken vervolgens uitgevoerd door individuele taakagenten die een kleiner deel van de taak voltooien, zoals een ouder die de ene peuter vraagt om de glazen op tafel te zetten en de andere om de vorken neer te leggen; waarna 3) de resultaten van deze subtaken worden gecontroleerd door een validatieagent; en 4) als er een fout wordt ontdekt, een verbeteringsagent een aanpassing aanbeveelt.
Een snelgroeiend ecosysteem van tools, methodologieën en diensten ondersteunt deze aanpak, en deze zijn uitstekend geschikt voor niet-kernprocessen. Maar wanneer u zich begeeft op het terrein van kernactiviteiten – waar data en controle over hallucinaties essentieel zijn – hebt u op maat gemaakte agents nodig, een diepere integratie met bedrijfssystemen en betere controle- en beveiligingsmaatregelen.
Een praktijkvoorbeeld: het opnieuw uitvinden van veldoperaties
Ter illustratie: neem bijvoorbeeld een project dat we hebben uitgevoerd voor een grote Europese internetprovider. Ons doel was om zowel de oplostijd als de kosten voor servicebezoeken te verminderen. De meeste mensen hebben wel eens meegemaakt dat ze de helpdesk hebben gebeld vanwege een verbroken verbinding, meerdere keren informatie hebben moeten herhalen en uiteindelijk op een technicus hebben moeten wachten. Wat er achter de schermen gebeurt (of niet gebeurt) is veelzeggend: technici komen vaak met onvolledige informatie aan en moeten het probleem helemaal opnieuw oplossen. Dit leidt tot lange uitvaltijden – soms meer dan een maand – en duizenden verspilde uren voor operators.
We besloten klein te beginnen. We concentreerden ons op het bouwen van een systeem dat technici hielp hun taken sneller en beter uit te voeren – een hulp in het proces, geen op zichzelf staande agent. Als onderdeel van deze inspanning hebben we data meer dan 15 informatiesystemen geïntegreerd, waardoor de technici een overzicht kregen van de gemelde storingen en een geschiedenis van de oplossingen die waren geprobeerd. Dit gaf hen een overzicht van de taak – bijvoorbeeld het oplossen van een verbindingsprobleem bij een klant – dat ze onderweg naar hun werk konden lezen of beluisteren. Op die manier konden ze meteen aan de slag om het probleem op te lossen zodra ze aankwamen, waardoor ze tijd bespaarden die vaak verloren ging met het inlezen van het probleem.
Vervolgens hebben we een functie ontwikkeld die aanbevelingen genereert voor de beste volgende stap om het probleem op te lossen. Een andere functie was een conversatie-interface waarmee de technicus organisatie natuurlijke taal de onderliggende IT-systemen van de organisatie kon doorzoeken om de onderliggende oorzaken te vinden. Ten slotte hebben we veel eenvoudige en repetitieve handelingen geautomatiseerd, zoals het corrigeren van CRM-records wanneer het verkeerde huishouden was gekoppeld of het resetten van het netwerk wanneer een switch in de centrale buurtconnectorbox defect raakte. Dit bespaarde de technicus enorm veel tijd, omdat hij niet meer het interne callcenter hoefde te bellen voor hulp bij kleine wijzigingen om het probleem op te lossen.
Gedurende acht maanden hebben we iteratief gewerkt: processen in kaart gebracht, knelpunten opgelost en stap voor stap functionaliteit toegevoegd, met wekelijkse feedback van technici in het veld die de tabletoplossing testten.
De resultaten:
- 60% vermindering van de oplostijd
- Meer dan een miljoen euro bespaard op jaarbasis
- Aanzienlijke verbetering vande netto promotorscore van klanten
Op basis van deze resultaten wilde de klant het uitbreiden naar zeven extra regio's. Dit vergde aanzienlijk meer werk: de methodologie en sommige agentcomponenten waren herbruikbaar, maar elke regio had andere IT-systemen. Elke uitrol vereiste nieuwe integraties en data . De uitbreiding naar elk van de zeven regio's kostte de helft van de oorspronkelijke inspanning per toegevoegde regio.
De uitdagingen bij de implementatie van multi-agent systemen
Zoals hierboven geïllustreerd, kunnen multi-agent-systeemimplementaties met succes echte waarde creëren, maar te weinig mensen praten over het echte werk dat komt kijken bij de implementatie ervan. Wat waren de realiteiten en obstakels waarmee we te maken hadden?
Snel testen versus opschalen.
Hebben we het vanaf het begin in een mooie schaalbare architectuur gebouwd? Hoe graag we dat ook zouden willen beweren, het zou onmogelijk zijn geweest. Net zoals innovators iteratief de product-marktfit ontdekken, zijn de use cases van het multi-agentsysteem en de oplossing iteratief geëvolueerd terwijl we ons bezighielden met een cyclus van snelle experimenten. Daarnaast zijn de technologie, methodologie en diensten om deze systemen te bouwen snel geëvolueerd.
We zijn niet begonnen met het volledige systeem. In plaats daarvan zijn we begonnen met één LLM plus RAG als centraal onderdeel om in principe de eerste use case op te lossen. Tijdens het testen kwamen we erachter dat we het systeem moesten opsplitsen in kleinere agents die meer gespecialiseerde taken uitvoeren om de betrouwbaarheid te vergroten. Langzaam maar zeker groeide dit uit tot een volledig agentisch systeem. Uiteindelijk hebben we een zeer betrouwbaar, functionerend systeem ontwikkeld dat waarde toevoegt. Met deze kennis en de resultaten die we nu hebben, bouwen we het opnieuw op tot een architectuur die veel robuuster is voor het opschalen van andere delen van de organisatie die gemakkelijker te onderhouden is.
Probleemgebieden versus onderliggende oorzaken.
Als vuistregel hebben we vastgesteld dat leidinggevenden en middenmanagers ongeveer weten welke processen veel tijd of moeite kosten, maar dat ze slecht geïnformeerde meningen hebben over waar de complexiteit en kansen liggen. Alleen de operators weten dit. Dit betekent dat u twee dingen moet doen voordat u echt kunt beginnen met bouwen: 1) voldoende tijd besteden aan het begrijpen van de problemen vanuit het perspectief van een manager, maar ook 2) met operators praten over wat zij zien als de hoofdoorzaak van een bepaald probleem.
Managers wezen ons bijvoorbeeld op delen van het proces waar tijd of middelen werden verspild (bijvoorbeeld in het shared service center) en vroegen ons om op zoek te gaan naar de juiste 'kennisitems' waarmee de operator een probleem sneller kon oplossen. Toen we echter rechtstreeks met de operators gingen samenwerken, ontdekten we dat de helft van de operators de 'kennisitems' binnen 10 seconden vond, terwijl de andere helft minuten nodig had om dezelfde informatie te vinden omdat ze niet goed waren in het doorzoeken van het systeem. Dit is geen probleem dat agentische AI goed AI oplossen – het is een kwestie van training. Maar we ontdekten ook dat leidinggevenden en managers volledig over het hoofd hadden gezien dat de operators ongeveer 50% van hun tijd besteden aan het invullen van het CRM-systeem na telefoontjes van klanten. Dit is een goed probleem voor een agent, die het gesprek kan transcriberen en alle informatie in de juiste velden kan invoeren, waardoor het proces aanzienlijk wordt versneld en data wordt verbeterd. De operator hoeft alleen maar te controleren en op OK te drukken.
IT-systemen vertragen je niet, mensen wel.
De meest arbeidsintensieve en complexe onderdelen van ons werk waren het voeren van de juiste managementgesprekken, het overtuigen van belanghebbenden en het identificeren en oplossen van afhankelijkheden die door ons werk waren ontstaan. De integratie met een tiental IT-systemen om de oplossing te laten werken is vanuit technologisch oogpunt complex, maar de echte uitdaging is dat al deze systemen hun eigen ontwikkelingsteams hebben met verschillende tijdschema's, prioriteiten en roadmaps. Het beschikbaar maken van API-eindpunten en het testen ervan kan wel twee weken werk zijn. Het kostte veel meer tijd om de respectieve roadmaps van deze systemen te doorgronden. De meeste teams waarmee we samenwerkten, gaven deze werkzaamheden maandenlang geen prioriteit, met het argument (dat vanuit hun standpunt waarschijnlijk terecht was) dat ze belangrijkere werkzaamheden hadden die voorrang hadden.
Modellen kunnen en zullen hallucineren.
Agenten zijn nog steeds vrij onstabiel en kunnen hallucineren, waardoor er sterke vangrails en controles nodig zijn in de vorm van LLM-as-a-judge (de validatieagent). De systeemprompt van de agent moet sterk genoeg zijn, maar ook licht genoeg zodat de agent taken correct kan uitvoeren. Dit vereist nuance, tijd en vaardigheden data gebied van data en data om deze agentische systemen met voldoende betrouwbaarheid te laten werken, zodat ze in uw bedrijf kunnen worden ingezet. Met andere woorden, goede ontwikkelaars en ervaring in het bedrijfsleven zijn nog steeds erg relevant.
De nieuwe discipline van agentische transformatie
Welke meer algemene lessen kunnen we uit deze casus trekken? In veel opzichten voelt het als een herontdekking van Lean: het werk vanaf de basis opnieuw inrichten. Het verschil is dat de huidige tools veel krachtiger zijn, waardoor niet alleen incrementele optimalisatie mogelijk is, maar ook een volledig herontwerp van processen, zelfs tussen afdelingen.
Naast data AI hangt succes af van een grondige kennis van processen: inzicht in de huidige situatie, een visie op de toekomstige situatie en het vertalen daarvan naar kleine, haalbare stappen. In die zin zien we de terugkeer van'Lean Black Belts', maar deze keer worden ze aangedreven door generatieve AI.
Het werk is gedetailleerd en methodisch, niet glamoureus. Je moet stap voor stap te werk gaan. De aanpak is gebaseerd op methodiek, niet op magie. Elk nieuw bedrijfsgebied vereist een nieuwe analyse en aanpassing op maat.
Volledig autonome agents zijn nog ver weg. Voorlopig is de meest effectieve opzet er een waarbij een mens in de loop blijft, waardoor de operator slimmer, sneller en beter toegerust is.
De vooruitgang is in het begin geleidelijk. Pas wanneer de kernsystemen met elkaar zijn verbonden en de informatie soepel stroomt, worden grote efficiëntieverbeteringen zichtbaar.
Technologie evolueert ook sneller dan projecten. De tools die we acht maanden geleden gebruikten, zijn nu al verouderd. Daarom richten we ons op use cases die zich binnen een jaar terugverdienen, voordat de onderliggende technologie verandert.
Nog belangrijker is dat bedrijven interne capaciteiten moeten opbouwen:data , data , gen AI en wat sommigen nu context-engineers of gen AI belts noemen: mensen die processen grondig begrijpen en transformatie kunnen opsplitsen in haalbare stappen. organisatie deze capaciteiten als organisatie op te bouwen organisatie u sneller nieuwe agentische workflows ontwikkelen (naarmate de technologie evolueert), wat een echt onderscheidend vermogen ten opzichte van de concurrentie kan zijn.
Tot slot: hoewel deze initiatieven uiteindelijk zullen worden geïntegreerd in de normale bedrijfsvoering, is het essentieel om ze te starten met een sterk bestuur dat technische en zakelijke perspectieven verenigt. Die balans is wat experimenteren omzet in transformatie.
Het komende decennium
De hype AIGen AIis misschien groter dan de daadwerkelijke acceptatie, maar het potentieel ervan is reëel. Net als de revoluties van het internet en de smartphone eerder, zal deze platformverschuiving industrieën hervormen – niet door een plotselinge disruptieve verandering, maar door jarenlange gedisciplineerde vernieuwing.
De organisaties die succesvol zijn, zullen niet alleen tools invoeren, maar ook het vermogen ontwikkelen om zichzelf voortdurend opnieuw uit te vinden met behulp van deze tools.

BLOG










