AI steeds meer proofs of concept (PoC’s) op het gebied van generatieve AI , vooral bij grote bedrijven. Maar vanwege de complexiteit ervan zijn er maar weinig initiatieven daadwerkelijk in de praktijk gebracht.

Hanan Ouazan, partner en AI Generatieve AI bij Artefact, maakt in dit artikel van Christophe Auffray, journalist bij LeMagIT, de balans op en bekijkt hoe er verbeteringen kunnen worden aangebracht.

“De invoering van generatieve artificial intelligence bij Franse bedrijven allesbehalve uniform. De omvang van het bedrijf blijft een doorslaggevende factor. Maar de meeste grote concerns hebben al stappen ondernomen (strategie, proof of concept, enz.); slechts enkele lopen vandaag de dag nog achter.”
Hanan Ouazan, AI Generatieve AI bij Artefact

Kleine en middelgrote ondernemingen (KMO’s) zijn daarentegen terughoudender. „Niet alle organisaties zitten op dezelfde golflengte”, merkt Hanan op. „Grote bedrijven zijn de eersten die zich hiermee bezighouden. Maar dat betekent niet dat de ‘grote jongens’ de technologie al volledig onder de knie hebben.”

De complexiteit van de industrialisatie

“Een jaar geleden hadden we al voorzien wat de grootste uitdaging bij generatieve AI zou zijn, namelijk de industriële toepassing ervan. […] Een paar jaar geleden artificial intelligence een proof of concept (PoC) op het gebied van [klassieke] artificial intelligence drie tot vier maanden artificial intelligence . Voor GenAI volstaan twee tot drie weken wellicht al. De industriële toepassing is echter een heel ander verhaal. Bedrijven beginnen zich de beperkingen van PoC-initiatieven te realiseren.”

Daarnaast speelt het probleem van de acceptatie een rol, met name bij oplossingen AI„ingebouwde AIzoals Copilots. Het is niet vanzelfsprekend dat deze worden gebruikt. Bovendien moet het rendement van deze tools nog worden vastgesteld.
Ook interne oplossingen, oftewel „zelf ontwikkeld“ in plaats van „aangeschaft“, zijn niet immuun voor acceptatieproblemen.

Ondanks deze obstakels blijken sommige sectoren zich dynamisch te ontwikkelen op het gebied van generatieve AI, waaronder de detailhandel en de luxegoederenbranche. Hoewel de vooruitgang in die laatste sector volgens de GenAI-specialist Artefactachterblijft bij de aanvankelijke verwachtingen. Het bankwezen en de gezondheidszorg zouden nog verder achterlopen, maar dit is grotendeels te wijten aan problemen cloud het gebied van cloud naleving van regelgeving.

RAG, Search 2.0, automatisering, creativiteit: vier categorieën en vier ontwikkelingsfasen

Ook op sectorniveau is er sprake van een tweesporenontwikkeling. Volgens Hanan loopt de industrie voorop in de race om de invoering ervan.

Maar zelfs bij de meest ervaren spelers blijven industrialisering en schaalvergroting (zowel wat betreft acceptatie als technologie) obstakels vormen. De use cases richten zich op Retrieval-Augmented Generation (RAG’s) voor het opzoeken van documenten in „vaak verwaarloosde databases“.

Het indexeren van content is bedoeld voor zowel interne (ter bevordering van de productiviteit) als externe (via conversatie-interfaces) toepassingen. Hanan noemt het voorbeeld van een fabrikant die meewerkt aan een project om zijn productcatalogus online toegankelijk te maken voor klanten – via een chatbot.

In de detailhandel AI generatieve AI ingezet om het zoeken opnieuw vorm te geven. Search 2.0, gebaseerd op GenAI, zou de zoekervaring ingrijpend veranderen door het verwoorden van een behoefte.

Zonder de naam van de retailer te noemen, Artefact mee aan het ontwerp van een oplossing op basis van intentiegebaseerd zoeken. „In de toekomst zal zoeken deel uitmaken van een belevingslogica”, voorspelt de AI generatieve AI .

Een derde categorie van gebruiksscenario’s is automatisering. Hieronder valt het analyseren van berichten en transcripties van callcenters van distributeurs om irritaties of problemen op te sporen.

“We verzamelen alle telefoongesprekken, zetten ze op tekst en analyseren ze vervolgens om een dashboard samen te stellen. Zo kunnen we bijvoorbeeld zien dat 3.000 gesprekken gaan over een bepaald product waarvan klanten vinden dat het kleiner is dan op de afbeelding in de productbeschrijving. Je kunt tot op dat detailniveau inzoomen.”

Voorheen was deze sentimentanalyse niet effectief genoeg. Nu kan het zelfs ironie herkennen.

Automatisering omvat ook toepassingen zoals trendanalyses op sociale netwerken of realtime data voor backoffice-activiteiten in het bank- en verzekeringswezen.

De vierde categorie is creativiteit. „Dit gebied is nog niet zo ver gevorderd als ik had verwacht, maar het begint nu echt van de grond te komen“, merkt Hanan op. Artefact met klanten om direct marketing te automatiseren, bijvoorbeeld door sms-berichten te personaliseren („contextualiseren“) om zo abonnementen te genereren op basis van criteria zoals het apparaat van de ontvanger.

Ook het genereren van afbeeldingen voor reclamedoeleinden is in opkomst. Deze toepassingen worden echter belemmerd door de juridische onzekerheid rond auteursrechten en data AI-systemen die afbeeldingen genereren. De juridische garanties die bepaalde uitgevers, waaronder Adobe, beloven, zouden de belemmeringen op dit gebied kunnen wegnemen.

De toepassingen van generatieve AI inmiddels goed in kaart gebracht. De impact in termen van daadwerkelijke transformatie moet echter met de nodige voorzichtigheid worden geïnterpreteerd, aangezien er nog maar weinig projecten in productie zijn en er nog minder toegankelijk zijn voor eindgebruikers.

“Er is een overvloed aan veilige GPT-tools. Maar het is niet bepaald moeilijk om die te ontwikkelen. Bovendien zijn de risico’s beperkt, aangezien de toepassingen intern zijn.”

Kosten, gebruikerservaring, kwaliteit en verandering zijn essentieel voor industrialisatie

Voor Hanan Ouazan is de reden voor deze evaluatie in 2024 duidelijk: de complexiteit van de industrialisering. Daar zijn verschillende redenen voor, niet in de laatste plaats de kosten: de gebruikersvergoedingen kunnen snel oplopen.

Niet alle bedrijven hebben echter rekening gehouden met het rendement op hun investering (ROI) voor hun specifieke toepassingen. Het gebruik van grote taalmodellen (LLM’s) leidt tot kosten die de inkomsten ver overstijgen, of dat nu voorzien was of niet. En hoewel de prijs per gebruik van deze oplossingen het afgelopen jaar aanzienlijk is gedaald, maken ze applicaties op termijn complexer en moeilijker te onderhouden.

Dit kostenprobleem kan worden aangepakt met ‘optimalisatielogica’, bijvoorbeeld om de kosten van een chatbotgesprek te verlagen. Een chat wordt gefactureerd op basis van de lengte van de vraag en het antwoord. En elke nieuwe vraag wordt toegevoegd aan de gespreksgeschiedenis, waardoor de totale kosten per vraag stijgen.

“Voor een van onze industriële klanten houden we elke interactie met de chatbot bij. Zo kunnen we de kosten en oorzaken in kaart brengen. Het kan bijvoorbeeld zijn dat de chatbot moeite heeft om een product te herkennen, waardoor het aantal contactmomenten toeneemt. Monitoring is essentieel om corrigerende maatregelen te kunnen nemen.”

De gebruikerservaring is ook een cruciale factor. Om dit te garanderen, is de latentie van belang, maar daar hangt een prijskaartje aan. Op Azure kan het nodig zijn om Provisioned Throughput Units (PTU’s) aan te schaffen, “speciale en dure beheerde resources”.

Er is geen succesvolle adoptie mogelijk zonder rekening te houden met de betrokkenen

Hanan Ouazan noemt kwaliteit ook als een uitdaging voor de industrialisering. Het meten en bewaken van kwaliteit betekent „het opzetten van de juiste evaluatiecomponenten […] Op bepaalde gevoelige gebruikerspaden zetten we een AI in AI tot taak heeft de reactie van AI andere AI te valideren. Real-time evaluatieprocessen zorgen ervoor dat de kwaliteit van de reacties AIgeneratieve AIgewaarborgd blijft”, legt hij uit. „We integreren ook feedbackloops die gebruikmaken van gebruikersreacties om de resultaten te verbeteren.”

De industrialisering stuit uiteindelijk op een menselijke hindernis. Om in deze fase succes te boeken, zijn procesveranderingen nodig. Zo AI de overstap van een traditionele chatbot naar een versie op basis van generatieve AI het beroep van klantenservicemedewerker.

“Een dergelijke verandering moet worden ondersteund, met name bij het valideren van chatbot-reacties. Een deel van het gesprek kan AI validatie aan een AI worden toevertrouwd. En wanneer mensen ingrijpen, is het beter hen daarbij te ondersteunen om de verwerkingstijd te verkorten. En wanneer een mens aantekeningen maakt, AI de AI leren om een positieve spiraal in gang te zetten.”

Hanan pleit er ook voor om de acceptatie door gebruikers te bevorderen en de gebruikerservaring voorop te stellen.„De invoering mag geen moeizaam proces zijn. Dit is de aanpak Artefact bij een project om data in de productdatabase van een fabrikant te verbeteren. Mensen zouden zich niet moeten hoeven aanpassen aan generatieve AI. Het is aan de AI zich aan hen aan te passen, met name aan de manier waarop zij werken.“

Artefact bijvoorbeeld zijn oplossing voor het genereren van productgegevensbladen Artefact ; deze was oorspronkelijk ontworpen om rechtstreeks te worden geïntegreerd in het PIM-systeem – een tool die bij de medewerkers van het genoemde project weinig in de smaak viel.

“Onze aanpak bij generatieve AI bestaat erin een bedrijf te selecteren en de dagelijkse taken in kaart te brengen, om zo te bepalen bij welke taken AI de mens AI vervangen of de werkwijze AI aanpassen. De uitdaging is om te automatiseren wat geautomatiseerd kan worden en wat moeilijk is voor de functie, en om de arbeidsomstandigheden voor de mens te verbeteren waar dat mogelijk is. En dit kan niet zonder interactie met de beoogde gebruiker. Anders zal de acceptatie nihil zijn.”

Gebruikerstraining: De cursor aanpassen

Hoe zit het met snelle training? Voor Hanan draait alles om de gebruiker. Artefact medewerkersArtefact in de CRAFT-methode (Context, Rol, Actie, Formaat, Audience), die het juiste gebruik van AI beschrijft. Ervaren gebruikers kunnen worden getraind in het gebruik van modellen en de tools waarmee deze worden geïntegreerd. Sommige gebruikersgroepen zijn echter nog steeds gewend aan het gebruik van trefwoorden.

De organisatie medewerkers over de mogelijkheid om zoekopdrachten in natuurlijke taal in te voeren. Daarnaast heeft zij de functie ‘herformuleren’ geïntroduceerd. Wanneer er trefwoorden (PUK-code) worden ingevoerd, herformuleert de tool de zoekopdracht als volgt: “Bent u op zoek naar uw PUK-code?”

“Er is een schuifbalk die moet worden aangepast aan de doelgroep waarvoor de tool bedoeld is. Maar ik denk dat naarmate de mogelijkheden van generatieve AI verbeteren, het uiteindelijk niet meer nodig zal zijn om prompts in te voeren,” verduidelijkt Hanan.

Twee toekomstige projecten in de schijnwerpers

In 2024 zijn er twee belangrijke aandachtsgebieden op het gebied van generatieve AI. Het eerste betreft de invoering ervan, waarbij wordt gekeken naar veranderingen in beroepen, loopbanen en vaardigheden.

Het tweede punt is opschaling. Dit wordt op twee niveaus getest: op het gebied van governance (prioritering van behoeften, ROI en sturing van initiatieven) en op het GenAI-platform.

Hanan constateert een toename van het aantal RAG’s, een ontwikkeling die wordt aangewakkerd door de vele proof-of-concept-projecten die worden uitgevoerd. Als gevolg daarvan zullen bedrijven de bouwstenen die ze in hun experimenten gebruiken, moeten stroomlijnen.

“Morgen zullen we RAG als een data moeten zien. Het heeft een plek als product binnen de onderneming, net zoals LLM een plek als product heeft.

“Veel mensen dachten dat GenAI iets magisch was dat hen zou bevrijden van de beperkingen uit het verleden. In werkelijkheid brengt GenAI juist nog meer beperkingen met zich mee,” waarschuwt de deskundige Artefact.

Deze ontwikkeling maakt deel uit van een continuüm. Na DevOps en vervolgens MLOps, dat specifiek gericht is op AI, doet nu LLMOps zijn intrede. „De waarborgen die met MLOps zijn vastgelegd, blijven relevant. Maar we moeten daar nog iets aan toevoegen om rekening te houden met kosten, hallucinaties en het generatieve karakter van modellen“, concludeert Hanan.

Lees het artikel op

class="lazyload

.