Inleiding
Sinds de explosieve opkomst halverwege 2022 heeft generatief AI snel wereldwijde aandacht getrokken. Wat zich aanvankelijk concentreerde op de taalmodaliteit is sindsdien uitgebreid naar spannende nieuwe wegen, waaronder beeld-, audio- en videomodellen. In het begin van 2023 groeide de speculatie over de mogelijke impact van de technologie op bedrijven in verschillende sectoren, vergezeld van opwindende vroege adoptiegevallen. Naarmate meer ontwikkelaars oplossingen begonnen te bouwen met deze modellen, verschoof de algemene perceptie naar de voortdurende opkomst van nieuwere, grotere en hopelijk betere versies van de meest gebruikte modellen.
Bij het ingaan van 2024 is een belangrijk inzicht naar voren gekomen: AI implementeren is niet simpelweg het nieuwste, grootste model van de plank gebruiken. Hoewel vaak wordt aangenomen dat AI oplossingen kant-en-klaar zijn of dat een groter model automatisch tot betere resultaten leidt, voldoet deze aanpak zelden aan de gespecialiseerde behoeften van de meeste bedrijven. In werkelijkheid vereisen succesvolle toepassingen AI oplossingen die op maat gemaakt, flexibel en efficiënt zijn.
Om dit te bereiken maken we gebruik van samengestelde AI systemen. In tegenstelling tot enkelvoudige, monolithische modellen, integreren samengestelde AI systemen meerdere gespecialiseerde AI componenten, elk geoptimaliseerd voor een specifieke rol. Deze structuur zorgt voor een hoge aanpasbaarheid, aanpasbaarheid en precisie, waardoor AI verandert van een algemene tool in een speciaal gebouwde oplossing. Door kleinere, onderling verbonden AI componenten te combineren, kunnen bedrijven prestaties en resultaten bereiken die veel verder gaan dan het bereik van kant-en-klare modellen alleen. Daarom stellen wij dat, voor een optimale zakelijke impact in verschillende industrieën, een strategische visie voorrang moet geven aan slimmere systeemontwerpen boven het simpelweg bouwen van grotere, meer rekenintensieve modellen.
Inzicht in samengestelde AI systemen
Het Berkeley Artificial Intelligence Research lab (BAIR) definieert een samengesteld AI systeem als een systeem "dat AI taken aanpakt met behulp van meerdere op elkaar inwerkende componenten, waaronder meerdere aanroepen naar modellen, retrievers of externe tools". Retrieval Augmented Generation (RAG) is bijvoorbeeld een samengesteld systeem dat een Large Language Model (LLM), een Information Retrieval mechanisme en een gevectoriseerde database combineert. Een generatief AI model is daarentegen een statistisch model; een LLM voorspelt bijvoorbeeld het volgende token in tekst op basis van training data.
In deze context kan een model worden gezien als een enkel blok, terwijl een samengesteld AI systeem meer lijkt op een machine die bestaat uit meerdere bouwstenen die elk een specifieke functie hebben om het algemene doel van het systeem te bereiken.
![Compound AI Systems article – image 1 class="img-responsive](https://www.artefact.com//wp-content/uploads/2024/12/Compound-AI-Systems-article-image-1.png)
Modellen vs. AI Samengestelde systemen. Bron
Hoe zijn dergelijke systemen nuttig
Specialisatie: Een grote hamer is niet het juiste gereedschap voor alles
Voor specifieke toepassingen of industriebehoeften is een algemeen AI model zoals GPT-4 mogelijk niet voldoende. Hoewel dergelijke modellen krachtig zijn, zijn ze ontworpen om een breed scala aan taken aan te kunnen en missen ze mogelijk de gespecialiseerde kennis die nodig is voor specifieke toepassingen, waardoor het rendement voorbij een bepaald punt afneemt.
Een financiële instelling die bijvoorbeeld een chatbot wil ontwikkelen voor beleggingsanalyses of vermogensbeheer heeft een systeem nodig dat zowel gespecialiseerde kennis als bedrijfsspecifieke expertise bevat. Gezien de aard van de sector zijn er zorgen over privacy (het bedrijf kan on-premise oplossingen en exclusief gebruik van open modellen vereisen), nauwkeurigheid (de oplossingen moeten onberispelijk nauwkeurig zijn) en efficiëntie. Zelfs de krachtigste taalmodellen als stand-alone oplossing gebruiken zou zeker niet de optimale keuze zijn. In plaats daarvan zou een samengesteld AI systeem zeer effectief kunnen zijn door meerdere gespecialiseerde componenten te integreren, zoals Retrieval-Augmented Generation (RAG) systemen en op maat gemaakte AI agents. Deze aanpak zorgt ervoor dat elk onderdeel van het systeem geoptimaliseerd is voor zijn specifieke rol.
Flexibiliteit: Modulaire systemen passen zich gemakkelijk aan veranderende behoeften aan
Wanneer een systeem is opgebouwd uit modulaire componenten, wordt het vervangen of upgraden van afzonderlijke onderdelen veel eenvoudiger. Hetzelfde principe geldt voor samengestelde AI systemen, die zijn opgebouwd uit meerdere blokken. Als een onderdeel binnen een samengestelde AI oplossing verouderd raakt of niet meer voldoet aan nieuwe nalevingseisen, kan het worden vervangen zonder dat het hele systeem moet worden gereviseerd. Als er bijvoorbeeld een nieuw, geschikter model beschikbaar komt, kan dit in het systeem worden geïntegreerd om de oudere versie te vervangen. Ook als er een efficiënter mechanisme voor het ophalen van informatie wordt ontwikkeld, kan dit worden ingepast zonder de hele installatie te verstoren. Deze flexibiliteit strekt zich niet alleen uit tot modellen en opvraagsystemen, maar ook tot andere componenten, zoals data verwerkingseenheden, analyse-engines of nalevingsmodules.
Schaalbaarheid: Zwermen intelligente componenten overtreffen één enkele reus
De modulaire aard van samengestelde AI systemen services biedt aanzienlijke voordelen op het gebied van schaalbaarheid. Doordat individuele componenten onafhankelijk van elkaar kunnen worden geschaald, kunnen deze systemen efficiënt omgaan met toenemende data volumes en complexiteit zonder dat een complete revisie nodig is.
Een systeem kan worden geschaald door het te repliceren in een netwerk van systemen, waardoor theoretisch oneindige schaalbaarheid mogelijk is. Dit is de reden waarom een enkel taalmodel, hoe groot of krachtig het ook is (vanaf vandaag), niet effectief een zeer grote database kan doorzoeken naar een specifiek stuk informatie. Om de zoekmogelijkheden van een model op te schalen, zul je onvermijdelijk een systeem met meerdere componenten moeten maken om de zoekfunctie te verbeteren. Als zelfs de eenvoudigste taken, zoals het ophalen van informatie, niet effectief kunnen worden opgeschaald door een enkel model, dan wordt het duidelijk dat individuele componenten op zichzelf geen grootschalige, complexe toepassingen kunnen ondersteunen.
Waarom samengestelde AI systemen zakelijk zinvol zijn
Vanuit zakelijk oogpunt gaat het gebruik van samengestelde AI systemen verder dan technisch raffinement - het biedt strategische voordelen die rechtstreeks aansluiten bij de bedrijfsdoelstellingen. Je zou zelfs kunnen stellen dat als een bedrijf gebruik wil maken van generatieve AI, het geen andere keuze heeft dan een samengesteld systeem te bouwen (of aan te schaffen). Hoewel dit eenvoudig lijkt, is het een uitdaging voor de gangbare bedrijfsaanname dat standalone, kant-en-klare modellen voldoende zijn om aan gespecialiseerde eisen te voldoen.
Verbeterde klanttevredenheid
De meest geavanceerde AI modellen alleen kunnen geen gepersonaliseerde ervaring creëren. Dit kan alleen worden bereikt met een samengesteld systeem dat het mogelijk maakt om zeer op maat gemaakte en contextueel relevante klantervaringen te leveren. De Custom Neural Voice van Microsoft combineert bijvoorbeeld algemene LLM's met aangepaste stemtraining, waardoor merken digitale assistenten kunnen creëren die precies aansluiten bij hun unieke toon en stijl. Dit niveau van aanpassing is vooral krachtig in klantgerichte sectoren, zoals reclame, waar klanten positief reageren als ze zich speciaal en begrepen voelen. Vanuit zakelijk oogpunt resulteert het combineren van deze technologie met de mogelijkheid om context toe te voegen in gepersonaliseerde resultaten, wat uiteindelijk de klanttevredenheid verhoogt.
Kostenefficiëntie
In tegenstelling tot individuele modellen die een vast kwaliteitsniveau bieden tegen een vaste prijs, is AI services een flexibele configuratie van kosten en kwaliteit. Bedrijven kunnen bijvoorbeeld een kleiner, op instructies afgestemd model integreren met gespecialiseerde componenten, zoals zoekheuristieken, om resultaten van hoge kwaliteit te behalen tegen lagere kosten in vergelijking met grotere, op zichzelf staande modellen. Deze flexibiliteit maakt het gebruik van kleinere, mogelijk open-source modellen mogelijk die, met gerichte engineering, resultaten kunnen leveren die vergelijkbaar zijn met duurdere oplossingen.
Betere controle en meer vertrouwen
Voor bedrijven zijn betrouwbaarheid en betrouwbaarheid in AI outputs van cruciaal belang. Uitsluitend vertrouwen op individuele modellen kan het een uitdaging maken om consistent feitelijke, goed geformatteerde resultaten te behalen. Een vorige klant in de onderwijssector vroeg bijvoorbeeld om een oplossing voor het automatisch invullen van sollicitaties op basis van hun school data en informatie. In eerste instantie was ik maanden bezig met het maken van een sequentieel systeem op basis van geavanceerde prompt engineering, zonder gebruik te maken van een samengestelde aanpak. De resultaten verbeterden, maar kwamen nooit in de buurt van wat we konden presenteren als volledig ingevulde sollicitaties. Pas toen het concept van RAG werd geïntroduceerd, kwamen er volledig gecontroleerde resultaten. Maar zelfs RAG alleen was niet genoeg; er waren aanvullende componenten nodig om informatie te categoriseren, context samenhang te behouden en andere nuances te verwerken. Pas toen bereikten we de betrouwbaarheid en precisie die de klant nodig had.
Conclusie
Als we het huidige landschap van AI in industriële toepassingen bekijken, zien we een duidelijke trend: vertrouwen op één enkel model om complexe functies uit te voeren, blijkt vaak onbetrouwbaar. Naarmate de gebruikssituaties ingewikkelder worden en de acceptatie door ondernemingen toeneemt, zal de vraag naar zeer gespecialiseerde en capabele AI oplossingen alleen maar toenemen. Om aan deze vraag te voldoen, moet men een oplossingsarchitectuur orkestreren die verbeterde en gespecialiseerde modellen omvat, waarbij de valkuil van een smalle, eenzijdige scope wordt vermeden.
De gemeenschap van ontwikkelaars staat bol van spannende toepassingen op allerlei gebieden, van geneeskunde tot detailhandel, die allemaal zijn gemaakt door kleinere, gespecialiseerde componenten samen te voegen tot krachtige, op maat gemaakte oplossingen.
Zelfs AI alleen is niet slim genoeg om strategische bedrijfsdoelstellingen te bereiken. Het moet worden aangevuld met een hogere vorm van georkestreerde intelligentie.
Bijlage
Voorbeelden van samengestelde AI systemen
Hieronder volgt een verzameling van impactvolle en interessante samengestelde AI systemen die het nut van dit concept benadrukken. Ongeacht de infrastructuur die ontwikkelaars gebruiken, is het doel om te observeren hoe het combineren van verschillende AI componenten met andere tools een zeer specifiek doel kan bereiken.
RAG verbetert de uitvoer van een LLM door specifieke context te bieden die is verkregen uit een gevectoriseerde database die buiten de oorspronkelijke training van het model ligt data. Terwijl LLM's worden getraind op enorme datasets en miljarden parameters gebruiken om reacties te genereren, gaat RAG een stap verder. Het stelt de LLM in staat om toegang te krijgen tot specifieke, actuele informatie en hiernaar te verwijzen, of deze nu domeinspecifiek is of afkomstig is uit de interne kennisbank van een organisatie. Dit proces verbetert de relevantie, nauwkeurigheid en bruikbaarheid van de gegenereerde inhoud aanzienlijk, allemaal zonder dat het model opnieuw hoeft te worden getraind.
Ondernemingen met grote datasets die een efficiënte methode nodig hebben om interne kennis te organiseren, kunnen deze oplossing on-premise implementeren, met het model van hun keuze, om precieze stukjes informatie op te halen. Financiële analisten kunnen bijvoorbeeld snel relevante data vinden binnen historische reports zonder dat ze elk bestand handmatig hoeven door te spitten. Het model, versterkt door deze contextuele informatie, genereert ook nauwkeurigere en bruikbaardere antwoorden en stroomlijnt zo het hele proces voor het ophalen van informatie.
Het volgende is een typische RAG-architectuur:
![Compound AI Systems article – image 2 class="img-responsive](https://www.artefact.com//wp-content/uploads/2024/12/Compound-AI-Systems-article-image-2.png)
Algemene RAG-architectuur
Hieronder volgt een tabel met enkele veelvoorkomende samengestelde AI systemen(bron):
![Compound AI Systems article – image 3 class="img-responsive](https://www.artefact.com//wp-content/uploads/2024/12/Compound-AI-Systems-article-image-3.png)