Lees het artikel op

class="lazyload

Ook de acceptatie onder consumenten blijft relatief laag. Ondanks het gebruik van woorden als ‘revolutie’data dat de meeste gebruikers de technologie wekelijks gebruiken in plaats van dagelijks, in tegenstelling tot het frequentere gebruik van sociale netwerken of platforms zoals Google. Dit wijst erop dat generatieve AI nog AI echte gewoonte bij consumenten AI geworden. Mensen gebruiken het af en toe – soms intensief – maar het is nog geen vast onderdeel van het dagelijks leven geworden. Met andere woorden: de hype loopt nog steeds vooruit op de realiteit.

Ondanks deze reports zijn wij van mening dat generatieve AI een fundamentele verschuiving AI die qua omvang vergelijkbaar is met die van het internet of de smartphone. Het internet heeft ons ongeveer twintig jaar aan innovatie en organisatie opgeleverd. De smartphonerevolutie heeft geleid tot vijftien jaar groei, aangedreven door mobiele apps. Wij zijn ervan overtuigd dat generatieve AI een soortgelijk tijdperk van transformatie AI inluiden – wellicht een decennium of langer van nieuwe waardecreatie.

Een dergelijk patroon komt vaak voor bij nieuwe technologieën (eerst buitensporig optimisme, gevolgd door ontgoocheling en vervolgens daadwerkelijke waardecreatie, wat vaak wordt weergegeven inde Gartner-hype-cyclus). Naar onze mening overdrijven veel van de voornaamste AI wanneer ze stellig beweren dat hele sectoren van de economie binnenkort door AI zullen worden vervangen. Dat komt omdat echte, functionele AI gevestigde bedrijven hard werken is: er zijn relatief schone data, procesmapping en diepgaande experimenten voor nodig – en zelfs dan is vaak nog menselijke tussenkomst vereist. We zien echter wel echte vooruitgang achter de schermen, waarvan voorbeelden suggereren dat het gebruik van multi-agent-systemen om repetitieve taken te automatiseren en te vervangen kan leiden tot een langere, meer fundamentele stijging van de productiviteit.

Wij zijn van mening dat leiders niet moeten proberen te voorspellen wat er over tien jaar gaat gebeuren. In plaats daarvan moeten ze zich afvragen wat ze de komende twee jaar realistisch gezien kunnen bereiken. Op basis van de projecten die we sinds eind 2024 hebben uitgevoerd, AI agentische AI (in ieder geval op korte termijn) de echte gamechanger te zijn, die bedrijven echte meerwaarde biedt. De realiteit is ook dat de financiële opbrengsten per project goed zijn, maar geen van alle spectaculair. Deze incrementele winsten zijn vergelijkbaar met Lean, een vergelijking die Microsoft-CEOSatya Nadella ook heeft gemaakt.

Op basis van ons werk aan een reeks projecten waarin agentgebaseerde AI met succes worden geïmplementeerd, hebben we geconstateerd dat succes met deze technologie vereist dat men door de hype heen kijkt, begrijpt wat de technologie kan, en die mogelijkheden afstemt op concrete kansen om waarde te creëren. Daarnaast is een praktische aanpak nodig bij het implementeren van multi-agent-systemen, waarbij men experimenteert en van die ervaringen leert.

De opkomst van het agentgebaseerde workflowparadigma

De afgelopen jaren heeft de ontwikkeling van AI zich in hoog tempo door ten minste drie verschillende fasen heen gevormd:

  • Prompting (2022):Aanvankelijk was er veel enthousiasme voor ‘power prompts’. In proofs of concept (POC’s) leken prompts te werken. Maar in de praktijk nam de betrouwbaarheid al snel af. Bedrijfsprocessen vereisen doorgaans een nauwkeurigheid van 95–99%. Op basis van onze ervaring met meer dan 50 gevallen schatten we dat de nauwkeurigheid bij het gebruik van prompts alleen zelden hoger lag dan 70%.
  • Retrieval-Augmented Generation (RAG, 2023):RAG verbeterde de stabiliteit door AI generatieve AI te koppelen aan kennisbanken. Ook hier zagen de proof-of-concepts er veelbelovend uit, maar de complexiteit in de praktijk bracht vaak zwakke punten aan het licht die leidden tot een onaanvaardbaar lage nauwkeurigheid.
  • Agentgebaseerde systemen (2024 tot heden):De meest recente ontwikkelingen hebben betrekking op netwerken van kleine, gespecialiseerde agenten. Sommige leiden vragen door. Andere voeren nauwkeurig omschreven taken uit. Weer andere controleren en corrigeren de output. Cruciaal is dat dalende tokenkosten cascaderende multi-agent-systemen nu commercieel haalbaar maken. Dit gelaagde ontwerp zorgt voor een aanzienlijke verbetering van de betrouwbaarheid.

Dit najaar was er een explosieve toename van commerciële initiatieven op het gebied van agentische systemen. OpenAI gingsamenwerkingsverbanden aanmet Stripe en Shopify.Google kondigde zijn Agent Payment Protocol aan, dat het aankoop- en transactieproces automatiseert. Hoewel bedrijven wellicht geneigd zijn het voorbeeld van de techreuzen te volgen, zal de eerste golf van duurzame waarde zich hier wellicht niet manifesteren. In eenrecent onderzoek van Bain onder consumenten gaf 76% aan zich niet op hun gemak te voelen bij het gebruik van agentische systemen voor aankopen; de meesten noemden zorgen over veiligheid en privacy als reden voor hun terughoudendheid.

Klantgerichte situaties zijn niet geschikt voor de huidige mogelijkheden van AI . Ze zijn chaotisch en onvoorspelbaar; de input is ongestructureerd, de toon en context veranderen voortdurend, en toezichthouders en consumenten hebben weinig begrip voor fantasieën of fouten. Multi-agent-systemenkunneneen hoge mate van nauwkeurigheid bereiken, maar daarvoor moet elke individuele agent worden behandeld als een peuter. Je zou een peuter niet vragen om de tafel te dekken. Maar als je de taak opsplitst en hem stap voor stap begeleidt – “leg eerst een bord neer”, “voeg nu de vorken toe”, “daarna de glazen” – kan de peuter een zinvolle bijdrage leveren. Cruciaal is dat de omgeving ook onder controle moet zijn: geen luidruchtige broertjes en zusjes, geen afleidende huisdieren en slechts één ouder die instructies geeft. Maar door multi-agent-systemen te ontwikkelen die zijn gestructureerd zoals je een peuter instructies geeft – de taak opsplitsen, taken één voor één geven, de taken controleren op nauwkeurigheid – bouwen we opmerkelijk nauwkeurige systemen.

Het valt op dat deze systemen vaak bedoeld zijn voor back-endprocessen, waar perfectie niet essentieel is omdat er een mens bij betrokken is. Front-endexperimenten kunnen daarentegen weliswaar inspirerend zijn, maar zullen waarschijnlijk niet het eerste gebied zijn waarop daadwerkelijk bedrijfswaarde wordt gecreëerd. Back-end- en operationele processen vormen een vruchtbare bodem omdat ze gestructureerd en repetitief zijn – en dus veel geschikter voor agentgebaseerde workflowautomatisering. Taken met een strak afgebakende scope, goed gedefinieerde omgevingen en gestructureerde inputs kunnen leiden tot projecten die een zinvolle bijdrage leveren.

Het bouwen van agentgebaseerde systemen op bedrijfsniveau

Op bedrijfsniveau is het ontwerpen van deze systemen conceptueel eenvoudig, maar in de praktijk veeleisend. Als algemeen raamwerk voor het bouwen van multi-agent-systemen geldt het volgende: 1) een taak wordt naar een routeragent zoals Google ADK gestuurd, die – net als een ouder die een peuter instructies geeft – de taak in subtaken opsplitst; 2) worden de subtaken vervolgens uitgevoerd door individuele taakagenten die een kleiner deel van de taak voltooien, zoals de ouder die de ene peuter vraagt de glazen op tafel te zetten en de andere de vorken; waarna 3) de resultaten van deze subtaken worden gecontroleerd door een validatieagent; en 4) als er een fout wordt ontdekt, beveelt een verbeteringsagent een aanpassing aan.

Deze aanpak wordt ondersteund door een snelgroeiend ecosysteem van tools, methodieken en diensten, die uitstekend geschikt zijn voor niet-kernprocessen. Maar zodra je je op kernactiviteiten richt – waar data en controle over afwijkingen essentieel zijn – heb je op maat geprogrammeerde agents nodig, een diepere integratie met bedrijfssystemen en betere controle- en beveiligingsmaatregelen.

Een praktijkvoorbeeld: een nieuwe aanpak van de activiteiten in het veld

Ter illustratie: neem eens een project dat we hebben uitgevoerd voor een grote Europese internetprovider. Ons doel was om zowel de oplostijd als de kosten voor het afhandelen van serviceverzoeken te verminderen. De meeste mensen hebben wel eens meegemaakt dat ze de helpdesk belden vanwege een verbinding die niet werkte, waarbij ze informatie meerdere keren moesten herhalen en uiteindelijk moesten wachten op een technicus. Wat er achter de schermen gebeurt (of juist niet gebeurt) is veelzeggend: technici komen vaak aan met onvolledige informatie en zijn gedwongen om vanaf nul te beginnen met het oplossen van het probleem. Dit leidt tot lange uitvalperiodes – soms meer dan een maand – en duizenden verspilde uren van operators.

We besloten klein te beginnen. We richtten ons op het bouwen van een systeem dat erop gericht was technici te helpen hun taken sneller en beter uit te voeren – een hulpmiddel in het proces, geen op zichzelf staande oplossing. Als onderdeel van deze inspanning hebben we data meer dan 15 informatiesystemen geïntegreerd, waardoor de technici een overzicht kregen van de gemelde storingen en een geschiedenis van welke oplossingen al waren geprobeerd. Dit gaf hen een overzicht van de taak – bijvoorbeeld het oplossen van een verbindingsprobleem bij een klant – dat ze konden lezen of beluisteren terwijl ze onderweg waren naar de klus. Op die manier konden ze meteen aan de slag om het probleem op te lossen zodra ze aankwamen, waardoor ze tijd bespaarden die vaak verloren ging met het zich inwerken in het probleem.

Vervolgens hebben we een functie ontwikkeld die aanbevelingen genereerde voor de beste volgende stap om het probleem op te lossen. Een andere functie was een conversatie-interface waarmee de technicus organisatie natuurlijke taal vragen kon stellen aan de onderliggende IT-systemen van de organisatie om de onderliggende oorzaken te achterhalen. Ten slotte hebben we veel eenvoudige en repetitieve handelingen geautomatiseerd: bijvoorbeeld het corrigeren van CRM-records wanneer het verkeerde huishouden was gekoppeld, of het activeren van netwerkresets wanneer een switch in de centrale buurtconnectorbox defect raakte. Dit bespaarde de technicus enorm veel tijd, omdat hij niet meer het interne callcenter hoefde te bellen voor hulp bij kleine aanpassingen om het probleem op te lossen.

Gedurende acht maanden hebben we stapsgewijs gewerkt: we brachten processen in kaart, pakten knelpunten aan en voegden stap voor stap functionaliteit toe, waarbij we wekelijks feedback kregen van technici in het veld die de tabletoplossing testten.

De resultaten:

  • 60% kortere afhandelingstijd
  • Jaarlijks wordt er meer dan een miljoen euro bespaard
  • Aanzienlijke verbetering vande Net Promoter Score

Op basis van deze resultaten wilde de klant het systeem uitbreiden naar nog zeven regio’s. Dit vergde aanzienlijk meer werk: de methodologie en sommige agentcomponenten waren weliswaar herbruikbaar, maar elke regio beschikte over andere IT-systemen. Elke implementatie vereiste nieuwe integraties en data . De uitbreiding naar elk van de zeven regio’s kostte de helft van de inspanning die nodig was voor de oorspronkelijke uitbreiding per toegevoegde regio.

De uitdagingen bij de implementatie van multi-agent-systemen

Zoals hierboven is geïllustreerd, kunnen implementaties van multi-agent-systemen daadwerkelijk waarde creëren, maar er wordt te weinig gesproken over het daadwerkelijke werk dat met de implementatie ervan gepaard gaat. Wat waren de realiteiten en obstakels waarmee we te maken kregen?

Snel testen versus opschalen.

Hebben we het vanaf het begin in een mooie, schaalbare architectuur gebouwd? Hoe graag we dat ook zouden willen beweren, het zou onmogelijk zijn geweest. Net zoals innovators stap voor stap de product-marktcombinatie ontdekken, zijn de use cases voor het multi-agentensysteem en de oplossing zich stapsgewijs ontwikkeld terwijl we ons in een cyclus van snelle experimenten bevonden. Daarnaast hebben de technologie, de methodologie en de diensten voor het bouwen van deze systemen zich snel ontwikkeld.

We zijn niet meteen met het volledige systeem begonnen. In plaats daarvan zijn we gestart met één LLM in combinatie met RAG als centraal onderdeel om in feite de eerste use case op te lossen. Tijdens het testen kwamen we erachter dat we het systeem moesten opsplitsen in kleinere agents die meer gespecialiseerde taken uitvoeren om de betrouwbaarheid te verhogen; langzaam evolueerde dit naar een volledig agent-gebaseerd systeem. Uiteindelijk hebben we een zeer betrouwbaar, functionerend systeem ontwikkeld dat waarde oplevert. Met deze kennis en de resultaten die we nu hebben, bouwen we het opnieuw op tot een architectuur die veel robuuster is voor het opschalen van andere delen van de organisatie die gemakkelijker te onderhouden is.

Probleemgebieden versus onderliggende oorzaken.

Als vuistregel hebben we gemerkt dat leidinggevenden en middenmanagers wel ongeveer weten welke processen veel tijd of moeite kosten, maar dat ze een onjuist beeld hebben van waar de complexiteit en de kansen liggen. Alleen de uitvoerende medewerkers weten dit. Dit betekent dat je twee dingen moet doen voordat je echt kunt beginnen met bouwen: 1) voldoende tijd besteden aan het begrijpen van de kwesties vanuit het perspectief van een manager, maar ook 2) met uitvoerende medewerkers praten over wat volgens hen de hoofdoorzaak is van een bepaald probleem.

Managers wezen ons bijvoorbeeld op delen van het proces waar tijd of middelen werden verspild (bijvoorbeeld in het shared service center) en vroegen ons om op zoek te gaan naar de juiste „kennisitems“ waarmee de medewerker een probleem sneller kon oplossen. Toen we echter rechtstreeks met de operators gingen werken, ontdekten we dat de helft van de operators de 'kennisitems' binnen 10 seconden vond, terwijl de andere helft minuten nodig had om dezelfde informatie te vinden omdat ze niet goed waren in het doorzoeken van het systeem. Dit is geen probleem dat agentische AI goed AI oplossen – het is een kwestie van training. Maar we ontdekten ook dat leidinggevenden en managers volledig over het hoofd hadden gezien dat de operators ongeveer 50% van hun tijd besteden aan het invullen van het CRM na klantgesprekken. Dit is een prima taak voor een agent, die het gesprek kan transcriberen en alle informatie in de juiste velden kan plaatsen, waardoor het proces aanzienlijk wordt versneld en data wordt verbeterd. De operator hoeft alleen maar te controleren en op OK te drukken.

IT-systemen remmen je niet af – mensen doen dat.

De meest arbeidsintensieve en complexe aspecten van ons werk waren het voeren van de juiste managementgesprekken, het overtuigen van belanghebbenden en het in kaart brengen en oplossen van afhankelijkheden die door ons werk ontstonden. De integratie met een tiental IT-systemen om de oplossing te laten werken is vanuit technologisch oogpunt complex, maar de echte uitdaging is dat al deze systemen hun eigen ontwikkelingsteams hebben met verschillende tijdschema’s, prioriteiten en roadmaps. Het beschikbaar stellen van API-eindpunten en het grondig testen daarvan kostte misschien twee weken werk. Het was veel, veel tijdrovender om toegang te krijgen tot de respectievelijke roadmaps van deze systemen. De meeste teams waarmee we samenwerkten, gaven dit werk enkele maanden geen prioriteit, met het argument (waarschijnlijk terecht vanuit hun perspectief) dat ze belangrijkere taken hadden die voorrang kregen.

Modellen kunnen hallucineren en zullen dat ook doen.

Agents zijn nog steeds vrij onstabiel en kunnen ‘hallucineren’, waardoor er strenge veiligheidsmaatregelen en controles nodig zijn in de vorm van een LLM-as-a-judge (de validatieagent). De systeemprompt van de agent moet krachtig genoeg en toch licht genoeg zijn om de agent in staat te stellen taken correct uit te voeren. Dit vereist nuance, tijd en vaardigheden data en data om deze agentsystemen met voldoende betrouwbaarheid te laten werken, zodat ze in uw bedrijf kunnen worden ingezet. Met andere woorden: goede ontwikkelaars en ervaring in het bedrijfsleven zijn nog steeds zeer relevant.

De nieuwe discipline van agentische transformatie

Welke meer algemene lessen kunnen we uit dit geval trekken? In veel opzichten voelt het alsof we Lean opnieuw ontdekken – het werk vanaf de basis opnieuw vormgeven. Het verschil is dat de huidige instrumenten veel krachtiger zijn, waardoor niet alleen stapsgewijze optimalisatie mogelijk is, maar ook een volledige herinrichting van processen, zelfs over afdelingsgrenzen heen.

Naast data AI hangt succes af van een grondige proceskennis: inzicht in de huidige situatie, een visie op de toekomstige situatie en het vertalen daarvan naar kleine, haalbare stappen. In die zin zien we een comeback vande ‘Lean Black Belts’, maar deze keer worden ze ondersteund door generatieve AI.

Het werk is gedetailleerd en methodisch, niet glamoureus. Je moet stap voor stap te werk gaan. De aanpak is schaalbaar qua methode, niet qua magie. Elk nieuw bedrijfsonderdeel vereist een nieuwe analyse en een aanpassing op maat.

Volledig autonome systemen zijn nog ver weg. Voorlopig is de meest effectieve aanpak om de mens bij het proces te betrekken – zodat de operator slimmer, sneller en beter toegerust is.

In het begin verloopt de vooruitgang stap voor stap. Pas wanneer de kernsystemen met elkaar zijn verbonden en de informatie soepel stroomt, worden er aanzienlijke efficiëntiewinst geboekt.

Technologie ontwikkelt zich ook sneller dan projecten. De tools die we acht maanden geleden gebruikten, zijn nu al verouderd. Daarom richten we ons op use cases die zich binnen een jaar terugverdienen – voordat de onderliggende technologie verandert.

Wat nog belangrijker is, is dat bedrijven interne capaciteit moeten opbouwen:data , data , AI generatieve AI en wat sommigen tegenwoordig context-engineers of AI belts’ AI generatieve AI noemen: mensen die een grondig inzicht hebben in processen en transformatie kunnen opsplitsen in haalbare stappen. organisatie deze capaciteiten als organisatie op te bouwen organisatie u sneller nieuwe, agentische workflows ontwikkelen (naarmate de technologie zich verder ontwikkelt), wat een echt onderscheidend vermogen ten opzichte van de concurrentie kan zijn.

Tot slot: hoewel deze initiatieven op termijn in de normale bedrijfsvoering zullen worden geïntegreerd, is het van essentieel belang om ze te starten met een sterk bestuurskader – een kader dat technische en zakelijke perspectieven samenbrengt. Die balans is wat experimenteren tot transformatie maakt.

Het komende decennium

De hype AIgeneratieve AIloopt misschien vooruit op de daadwerkelijke toepassing ervan, maar het potentieel is reëel. Net als de revoluties van het internet en de smartphone eerder, zal deze platformverschuiving sectoren ingrijpend veranderen – niet door een plotselinge omwenteling, maar door jarenlange, gestage vernieuwing.

De organisaties die succesvol zullen zijn, zullen niet alleen tools invoeren; ze zullen ook het vermogen opbouwen om zich daarmee voortdurend opnieuw uit te vinden.