Inleiding
Sinds de explosieve opkomst halverwege 2022 heeft generatieve AI snel wereldwijde aandacht getrokken. Wat zich aanvankelijk concentreerde op de taalmodaliteit, heeft zich sindsdien uitgebreid naar spannende nieuwe wegen, waaronder beeld-, audio- en videomodellen. In het begin van 2023 groeide de speculatie over de mogelijke impact van de technologie op bedrijven in verschillende sectoren, vergezeld van opwindende eerste toepassingsgevallen. Naarmate meer ontwikkelaars oplossingen begonnen te bouwen met deze modellen, verschoof de algemene perceptie naar de voortdurende opkomst van nieuwere, grotere en hopelijk betere versies van de meest gebruikte modellen.
Nu we 2024 naderen, is een belangrijk inzicht aan het licht gekomen: AI inzetten is niet simpelweg het nieuwste, grootste model van de plank gebruiken. Hoewel vaak wordt aangenomen dat AI-oplossingen kant-en-klaar zijn of dat een groter model automatisch tot betere resultaten leidt, voldoet deze aanpak zelden aan de gespecialiseerde behoeften van de meeste bedrijven. In werkelijkheid vereisen succesvolle toepassingen AI-oplossingen die op maat gemaakt, flexibel en efficiënt zijn.
Om dit te bereiken, wenden we ons tot Samengestelde AI-systemen. In tegenstelling tot enkelvoudige, monolithische modellen, integreren samengestelde AI-systemen meerdere gespecialiseerde AI-componenten, elk geoptimaliseerd voor een specifieke rol. Deze structuur zorgt voor een hoge mate van aanpasbaarheid, aanpasbaarheid en precisie, waardoor AI verandert van een algemene tool in een doelgerichte oplossing. Door kleinere, onderling verbonden AI-componenten te combineren, kunnen bedrijven prestaties en resultaten behalen die veel verder gaan dan het bereik van kant-en-klare modellen alleen. Daarom stellen wij dat een strategische visie, voor een optimale zakelijke impact in verschillende sectoren, voorrang moet geven aan slimmere systeemontwerpen boven het simpelweg bouwen van grotere, rekenkundig veeleisendere modellen.
Samengestelde AI-systemen begrijpen
Het Berkeley Artificial Intelligence Research lab (BAIR) definieert een samengesteld AI-systeem als een systeem “die AI-taken aanpakt met behulp van meerdere op elkaar inwerkende componenten, waaronder meerdere oproepen naar modellen, retrievers of externe tools”. Bijvoorbeeld, Retrieval Augmented Generation (RAG)-systeem is een samengesteld systeem dat een Large Language Model (LLM), een Information Retrieval-mechanisme en een gevectoriseerde database combineert. Een generatief AI-model is daarentegen een statistisch model; Een LLM voorspelt bijvoorbeeld het volgende token in tekst op basis van training data.
In deze context kan een model worden gezien als een enkel blok, terwijl een samengesteld AI-systeem meer lijkt op een machine die bestaat uit meerdere bouwstenen, die elk een specifieke functie hebben om het algemene doel van het systeem te bereiken.

Modellen versus AI-samengestelde systemen. Bron
Hoe zijn dergelijke systemen nuttig
Specialisatie: Een grote hamer is niet het juiste gereedschap voor alles
Voor specifieke toepassingen of industriebehoeften is een algemeen AI-model zoals GPT-4 misschien niet voldoende. Hoewel dergelijke modellen krachtig zijn, zijn ze ontworpen om een breed scala aan taken uit te voeren en missen ze mogelijk de gespecialiseerde kennis die nodig is voor specifieke toepassingen, waardoor het rendement voorbij een bepaald punt afneemt.
Een financiële instelling die bijvoorbeeld een chatbot voor beleggingsanalyse of vermogensbeheer wil ontwikkelen, heeft een systeem nodig dat zowel gespecialiseerde kennis als bedrijfsspecifieke expertise bevat. Gezien de aard van de sector zijn er zorgen over privacy (het bedrijf kan on-premise oplossingen en exclusief gebruik van open modellen vereisen), nauwkeurigheid (de oplossingen moeten onberispelijk nauwkeurig zijn) en efficiëntie. Zelfs de krachtigste taalmodellen als stand-alone oplossing gebruiken zou zeker niet de optimale keuze zijn. In plaats daarvan zou een samengesteld AI-systeem zeer effectief kunnen zijn door meerdere gespecialiseerde componenten te integreren, zoals Retrieval-Augmented Generation (RAG)-systemen en op maat gemaakte AI-agenten. Deze aanpak zorgt ervoor dat elk onderdeel van het systeem geoptimaliseerd is voor zijn specifieke rol.
Flexibiliteit: Modulaire systemen passen zich gemakkelijk aan veranderende behoeften aan
Wanneer een systeem is opgebouwd uit modulaire componenten, wordt het vervangen of upgraden van individuele onderdelen veel eenvoudiger. Hetzelfde principe geldt voor samengestelde AI-systemen, die zijn opgebouwd uit meerdere blokken. Als een onderdeel binnen een samengestelde AI-oplossing verouderd raakt of niet meer voldoet aan nieuwe compliancevereisten, kan het vervangen worden zonder dat het hele systeem volledig gereviseerd hoeft te worden. Als er bijvoorbeeld een nieuw, geschikter model beschikbaar komt, kan dit in het systeem worden geïntegreerd om de oudere versie te vervangen. Ook als er een efficiënter mechanisme voor het ophalen van informatie wordt ontwikkeld, kan dit worden ingepast zonder de hele installatie te verstoren. Deze flexibiliteit geldt niet alleen voor modellen en opvraagsystemen, maar ook voor andere componenten, zoals data verwerkingseenheden, analyse-engines of nalevingsmodules.
Schaalbaarheid: Zwermen intelligente componenten overtreffen één enkele reus
De modulaire aard van samengestelde AI-systemen biedt aanzienlijke voordelen op het gebied van schaalbaarheid. Doordat afzonderlijke componenten onafhankelijk van elkaar geschaald kunnen worden, kunnen deze systemen efficiënt toenemende data volumes en complexiteit aan zonder dat een complete revisie nodig is.
Een systeem kan geschaald worden door het te repliceren in een netwerk van systemen, waardoor theoretisch oneindige schaalbaarheid mogelijk is. Dit is de reden waarom een enkel taalmodel, hoe groot of krachtig het ook is (vanaf vandaag), niet effectief een zeer grote database kan doorzoeken naar een specifiek stuk informatie. Om de zoekmogelijkheden van een model op te schalen, zult u onvermijdelijk een systeem met meerdere componenten moeten maken om de zoekfunctie te verbeteren. Als zelfs de eenvoudigste taken, zoals het ophalen van informatie, niet effectief kunnen worden opgeschaald door een enkel model, dan wordt het duidelijk dat individuele componenten op zichzelf geen grootschalige, complexe toepassingen kunnen ondersteunen.
Waarom samengestelde AI-systemen zakelijk zinvol zijn
Vanuit zakelijk oogpunt gaat het gebruik van samengestelde AI-systemen verder dan technische verfijning - het biedt strategische voordelen die direct aansluiten bij zakelijke doelstellingen. Men zou zelfs kunnen stellen dat als een bedrijf gebruik wil maken van generatieve AI, het geen andere keuze heeft dan een samengesteld systeem te bouwen (of aan te schaffen). Hoewel dit eenvoudig lijkt, is dit een uitdaging voor de gangbare bedrijfsaanname dat standalone, kant-en-klare modellen voldoende zijn om aan gespecialiseerde eisen te voldoen.
Verbeterde klanttevredenheid
De meest geavanceerde AI-modellen alleen kunnen geen gepersonaliseerde ervaring creëren. Dit kan alleen worden bereikt met een samengesteld systeem dat de levering van zeer op maat gemaakte en contextueel relevante klantervaringen mogelijk maakt. Bijvoorbeeld Microsofts Aangepaste neurale stem combineert algemene LLM's met stemtraining op maat, waardoor merken digitale assistenten kunnen creëren die precies aansluiten bij hun unieke toon en stijl. Dit niveau van aanpassing is vooral krachtig in klantgerichte sectoren, zoals reclame, waar klanten positief reageren als ze zich speciaal en begrepen voelen. Vanuit zakelijk oogpunt resulteert het combineren van deze technologie met de mogelijkheid om context toe te voegen in gepersonaliseerde resultaten, wat uiteindelijk de klanttevredenheid verhoogt.
Kostenefficiëntie
In tegenstelling tot afzonderlijke modellen die een vast kwaliteitsniveau tegen vaste kosten bieden, biedt samengestelde AI flexibele configuraties voor kosten en kwaliteit. Bedrijven kunnen bijvoorbeeld een kleiner, op instructies afgestemd model integreren met gespecialiseerde componenten, zoals zoekheuristieken, om resultaten van hoge kwaliteit te behalen tegen lagere kosten in vergelijking met grotere, op zichzelf staande modellen. Deze flexibiliteit maakt het gebruik van kleinere, mogelijk open-source modellen mogelijk die, met gerichte engineering, resultaten kunnen leveren die vergelijkbaar zijn met duurdere oplossingen.
Betere controle en meer vertrouwen
Voor bedrijven zijn betrouwbaarheid en betrouwbaarheid van AI-uitvoer van cruciaal belang. Uitsluitend vertrouwen op individuele modellen kan het een uitdaging maken om consistent feitelijke, goed geformatteerde resultaten te behalen. Een vorige klant in de onderwijssector vroeg bijvoorbeeld om een oplossing voor het automatisch invullen van sollicitaties op basis van hun school data en informatie. In eerste instantie was ik maanden bezig met het maken van een sequentieel systeem op basis van geavanceerde prompt engineering, zonder gebruik te maken van een samengestelde aanpak. De resultaten verbeterden, maar kwamen nooit in de buurt van wat we als volledig ingevulde sollicitaties konden presenteren. Pas toen het concept van RAG werd geïntroduceerd, kwamen er volledig gecontroleerde resultaten. Maar zelfs RAG alleen was niet genoeg; er waren aanvullende componenten nodig om informatie te categoriseren, contextcoherentie te behouden en andere nuances te verwerken. Pas toen bereikten we de betrouwbaarheid en precisie die de klant nodig had.
Conclusie
Als we het huidige landschap van AI in industriële toepassingen bekijken, zien we een duidelijke trend: vertrouwen op één enkel model om complexe functies uit te voeren, blijkt vaak onbetrouwbaar. Naarmate de gebruikssituaties ingewikkelder worden en de acceptatie door bedrijven toeneemt, zal de vraag naar zeer gespecialiseerde en capabele AI-oplossingen toenemen. Om aan deze vraag te voldoen, moet men een oplossingsarchitectuur orkestreren die verbeterde en gespecialiseerde modellen omvat, waarbij de valkuil van een smalle, eenzijdige reikwijdte wordt vermeden.
De gemeenschap van ontwikkelaars staat bol van spannende toepassingen op allerlei gebieden, van geneeskunde tot detailhandel, die allemaal gebouwd zijn door kleinere, gespecialiseerde componenten samen te voegen tot krachtige, op maat gemaakte oplossingen.
Zelfs AI alleen is niet slim genoeg om strategische bedrijfsdoelstellingen te bereiken. Het moet worden aangevuld met een hogere vorm van georkestreerde intelligentie.
Bijlage
Voorbeelden van samengestelde AI-systemen
Hieronder volgt een verzameling van impactvolle en interessante samengestelde AI-systemen die het nut van dit concept benadrukken. Ongeacht de infrastructuur die ontwikkelaars gebruiken, is het doel om te observeren hoe het combineren van verschillende AI-componenten met andere tools een zeer specifiek doel kan bereiken.
RAG verbetert de uitvoer van een LLM door specifieke context te bieden die verkregen is uit een gevectoriseerde data-basis die buiten de oorspronkelijke trainings data van het model ligt. Terwijl LLM's worden getraind op enorme datasets en miljarden parameters gebruiken om reacties te genereren, gaat RAG een stap verder. Het stelt de LLM in staat om toegang te krijgen tot specifieke, actuele informatie en hiernaar te verwijzen, of deze nu domeinspecifiek is of afkomstig is uit de interne kennisbank van een organisatie. Dit proces verbetert de relevantie, nauwkeurigheid en bruikbaarheid van de gegenereerde inhoud aanzienlijk, allemaal zonder dat het model opnieuw getraind hoeft te worden.
Ondernemingen met grote datasets die een efficiënte methode nodig hebben om interne kennis te organiseren, kunnen deze oplossing on-premise implementeren, met het model van hun keuze, om precieze stukjes informatie op te halen. Financiële analisten kunnen bijvoorbeeld snel relevante data vinden binnen historische reports zonder dat ze ze allemaal handmatig hoeven door te spitten. Het model, versterkt door deze contextuele informatie, genereert ook nauwkeurigere en bruikbaardere antwoorden, waardoor het hele proces voor het ophalen van informatie wordt gestroomlijnd.
Hieronder ziet u een typische RAG-architectuur:

Algemene RAG-architectuur
Hieronder volgt een tabel met enkele veelvoorkomende samengestelde AI-systemen (bron):


BLOG






