Artikel geschreven voor de Medium blog door Artefact experts in samenwerking met de French Tech Corporate Community.
De overvloed en diversiteit van reacties op ChatGPT en andere generatieve AI's, of ze nu sceptisch of enthousiast zijn, laten zien welke veranderingen ze teweegbrengen en welke impact ze hebben tot ver buiten de gebruikelijke technologiekringen. Dit staat in schril contrast met eerdere generaties van AI, die voornamelijk voorspellend waren en over het algemeen het onderwerp waren van artikelen of scripties die beperkt bleven tot onderzoek en innovatie.
Voor bedrijven is generatieve AI ook anders dan eerdere artificial intelligence's. Als we ze vergelijken met de meest vergelijkbare technologieën, zoals natuurlijke taalverwerking (NLP) voor tekstcorpora of computervisie voor audiovisuele data, brengen generatieve AI's vier grote veranderingen met zich mee waarvan bedrijven zich bewust worden naarmate ze ermee experimenteren.
Ten eerste versnelt generatieve AI, in vergelijking met eerdere AI, de inzet van use-cases aanzienlijk, in die zin dat het proof of concept versneld wordt. Ten tweede openen ze een nieuw rijk aan mogelijkheden, waardoor ongestructureerde data eenvoudiger, efficiënter en goedkoper kan worden verbeterd. Bovendien zijn de resultaten die verkregen worden met generatieve AI nieuw in termen van kwaliteit, kwantiteit en diversiteit in vergelijking met de eerder gebruikte modellen. Al deze factoren betekenen dat we moeten inspelen op de hogere verwachtingen van eindgebruikers, die gevoed worden door de hype rond deze technologie. We werken deze vier punten hieronder uit.
Generatieve AI maakt sneller testen van de toegevoegde waarde van use cases mogelijk
Op het gebied van generatieve AI is de inzet van use-cases vaak sneller en minder arbeidsintensief dan bij eerdere AI's. De aanpak van generatieve AI wordt vaak vergeleken met het in elkaar zetten van Lego, waarbij reeds bestaande onderdelen gecombineerd kunnen worden om nieuwe resultaten te creëren. Dit gemak van experimenteren en implementeren kan kortere ontwikkelingscycli mogelijk maken. Daarnaast versnelt een conversatieve interactiemodus met gebruikers ook de adoptie.
Een data use case kan worden gereduceerd tot een bedrijfsprobleem, data, een model en een prompt. Traditioneel is het maken en optimaliseren van het model het meest complexe en tijdrovende deel van het proces. Met generatieve AI wordt deze stap eenvoudiger. Generatieve AI biedt vooraf getrainde, kant-en-klare modellen, waardoor bedrijven kunnen profiteren van geavanceerde expertise zonder veel tijd te hoeven investeren in het ontwikkelen en verfijnen van modellen. In de praktijk zijn modellen (zoals GPT 4.0 van Azure) “on-demand” toegankelijk of kunnen ze worden ingezet via API's (zoals Gemini Pro BARD van Google). Sommige aanbieders bieden zelfs speciaal afgestemde modellen voor specifieke domeinen, zoals het genereren van juridische, medische of financiële teksten.
Zodra het model is ingezet, is de enige taak die overblijft het generatieve AI-model te “aarden”, d.w.z. de resultaten die door het model worden gegenereerd te verankeren aan informatie uit de echte wereld, zodat het model wordt gedwongen om binnen een bepaalde perimeter te reageren. Dit houdt vaak in dat er beperkingen of extra informatie moet worden toegevoegd om het model te leiden naar het produceren van resultaten die coherent en relevant zijn in een specifieke context. Dit staat echter ver af van de tijd die het kost om de AI-modellen die we tot nu toe gebruikten te trainen.
Laten we het voorbeeld van een verbatim analyse use case voor een callcenter nemen om ons punt te illustreren. Volgens een Artefact onderzoek duurde het voor het ontwikkelen van dit type use case met behulp van modellen gebaseerd op eerdere AI over het algemeen drie tot vier weken vanaf het moment dat de data werd opgehaald en bruikbaar gemaakt. Tegenwoordig duurt dit proces dankzij generatieve AI slechts één week, een versnellingsfactor van meer dan drie. De grootste uitdaging is om de juiste bedrijfsclassificatie te kiezen om het model aan te passen.
Generatieve AI breidt de reikwijdte van AI uit naar voorheen weinig gebruikte of misbruikte data
Sommige olievelden zijn alleen winstgevend als de olieprijzen de pan uit rijzen. Hetzelfde principe kan worden toegepast op data. Bepaalde ongestructureerde data kan nu ontgonnen worden dankzij generatieve AI, wat een heel nieuw veld van exploiteerbare data opent voor het trainen of verfijnen van modellen, en tal van vooruitzichten biedt voor toepassingen die zich specialiseren in specifieke domeinen.
En er is een opkomende belofte: die van generatieve AI's die in staat zijn om elk type data te verwerken en te combineren in hun trainingsprocessen, waarbij het tijdrovende en vervelende werk van het structureren en verbeteren van de kwaliteit van bedrijfs data om het bruikbaar te maken, overgeslagen wordt. Een belofte die op basis van de huidige waarnemingen nog niet is ingelost.
Generatieve AI heeft niet alleen geprofiteerd van een echte doorbraak in aandachtsmechanismen. Het heeft ook geprofiteerd van de steeds toenemende - en noodzakelijke - kracht van machines.
Aandachtsmechanismen werken een beetje zoals het vermogen van een persoon om zich te concentreren op een belangrijk deel van een afbeelding of tekst wanneer hij iets probeert te begrijpen of te creëren. Stelt u zich eens voor dat u een landschap van een foto probeert te tekenen. In plaats van de hele foto in één keer te bekijken, concentreert u zich op bepaalde delen die belangrijk lijken, zoals bergen of bomen. Dit helpt u om belangrijke details beter te begrijpen en een nauwkeurigere tekening te maken. Op dezelfde manier zorgen aandachtsmechanismen ervoor dat het model zich bij het genereren van inhoud kan richten op specifieke delen van een afbeelding of tekst. In plaats van alle invoer in één keer te verwerken, kan het model zich richten op de meest relevante en belangrijke delen om nauwkeurigere en betekenisvollere resultaten te produceren. Hierdoor kan het model leren om afbeeldingen, tekst of andere soorten inhoud efficiënter en realistischer te maken.
Aandachtsmechanismen zijn zeer goed te parallelliseren. Het gebruik van meerdere aandachtsmechanismen zorgt voor een rijkere en robuustere representatie van data, wat leidt tot betere prestaties in verschillende taken zoals machinevertaling, tekstgeneratie, spraaksynthese, beeldgeneratie en vele andere.
Hierdoor zijn gebruikssituaties die nog niet zo lang geleden onmogelijk leken, nu volledig toegankelijk geworden. Dit is bijvoorbeeld het geval bij het berekenen van de spreektijd in de media tijdens presidentiële campagnes. Nog maar twee jaar geleden was het nauwkeurig berekenen van de spreektijd van elke kandidaat een vervelende bezigheid. Vandaag de dag is het mogelijk, dankzij het gebruik van generatieve AI.
Wat de rekencapaciteiten betreft, heeft OpenAI zes jaar geleden een analyse gepubliceerd waaruit blijkt dat de hoeveelheid rekenkracht die gebruikt wordt in de belangrijkste AI-trainingssessies sinds 2012 exponentieel is toegenomen, met een verdubbelingstijd van 3,4 maanden (ter vergelijking: de Wet van Moore had een verdubbelingstijd van twee jaar). Sinds 2012 is deze maatstaf met meer dan 300.000 keer toegenomen (een verdubbeling van twee jaar zou slechts een verzevenvoudiging opleveren).
Generatieve AI-modellen vereisen vaak enorme hoeveelheden rekenkracht voor training, vooral omdat de modellen ontworpen zijn om generalistisch te zijn en enorme hoeveelheden inhoud nodig hebben voor training. Krachtige computerbronnen, zoals high-end GPU's of TPU's, zijn nodig om grote datasets te verwerken en complexe optimalisatiealgoritmen uit te voeren. De nieuwe NVIDIA A100 Tensor Core GPU lijkt een ongekende versnelling te bieden. Volgens NVIDIA biedt de A100 prestaties die tot 20 keer hoger liggen dan die van de vorige generatie en kan hij worden opgedeeld in zeven GPU-instanties om zich dynamisch aan te passen aan veranderende eisen. Het beschikt naar verluidt ook over de snelste geheugenbandbreedte ter wereld, met meer dan twee terabytes per seconde (TB/s) voor het uitvoeren van de grootste modellen en datasets.
Opgemerkt moet worden dat verbeteringen in computers een belangrijk element zijn geweest in de vooruitgang van artificial intelligence. Zolang deze trend zich voortzet, moeten we voorbereid zijn op de implicaties van systemen die de huidige mogelijkheden ver overtreffen en die de grenzen verder zullen verleggen, terwijl we de waarde van deze systemen moeten afwegen tegen de kosten die ze met zich meebrengen, vooral op het gebied van energie en milieu. We zullen deze punten in een toekomstig artikel bespreken.
Generatieve AI verbetert de diversiteit, kwaliteit en kwantiteit van de verkregen resultaten
Generatieve AI verschilt duidelijk van eerdere AI door de impact op de resultaten die door de modellen worden gegenereerd. Niet alleen is de hoeveelheid gegenereerde resultaten toegenomen, maar ook de kwaliteit en diversiteit ervan. Al deze positieve aspecten moeten echter getemperd worden door een lagere reproduceerbaarheid van generatieve AI-modellen.
Als we het beeld van een legpuzzel bekijken, kan de analyse van data vergeleken worden met de assemblage ervan, waarbij elk stukje data een stukje voorstelt dat gerangschikt moet worden om een samenhangend beeld te onthullen. AI speelt een cruciale rol bij het proberen in te vullen van de ontbrekende data door de beschikbare informatie te gebruiken om die ontbrekende stukjes af te leiden en opnieuw te maken. Generatieve AI gaat verder dan het simpelweg aanvullen van bestaande data door nieuwe data te creëren die geïnspireerd zijn op wat al bestaat. Dit proces breidt de analysemogelijkheden uit en maakt het mogelijk om nieuwe informatie te ontdekken uit bestaande data, waardoor het generatieve aspect op de voorgrond treedt.

In tegenstelling tot eerdere generaties van AI, die vaak soortgelijke resultaten produceren, kunnen generatieve AI-modellen een grotere diversiteit aan resultaten genereren door verschillende variaties en alternatieven te onderzoeken. Deze grotere diversiteit maakt het mogelijk om rijkere, meer gediversifieerde inhoud te genereren, van kwantitatief naar kwalitatief te gaan en een breder scala aan behoeften en voorkeuren te bestrijken.
OpenAI was onlangs in Hollywood om zijn nieuwste model, “Sora” genaamd, te laten zien, dat video's uit tekst kan genereren. “Horen dat het al deze dingen kan is één ding, maar de mogelijkheden daadwerkelijk zien was verbazingwekkend,” zei Hollywood producer Mike Perry, die de diversiteit en kwaliteit van de mogelijkheden van generatieve AI benadrukte.
Door hun vermogen om een bredere ruimte van mogelijkheden te verkennen, kunnen generatieve AI-modellen echter minder reproduceerbaar zijn dan eerdere AI's, en komt de nauwkeurigheid van de resultaten in het gedrang. Concreet is het moeilijker om telkens als het model wordt uitgevoerd exact dezelfde resultaten te reproduceren, wat uitdagingen kan opleveren op het gebied van betrouwbaarheid en voorspelbaarheid in bepaalde missiekritische toepassingen.
Deze beperking vormt een grote uitdaging voor toepassingen van generatieve AI die precieze antwoorden vereisen. En het is een gebied waar bedrijven in hun huidige ontwikkelingen aan werken: om modellen beter te specialiseren in zeer specifieke domeinen om de nauwkeurigheid van antwoorden te verbeteren, en om de robuustheid van regelgebaseerde modellen of query's op gestructureerde data te combineren met het gebruiksgemak en de interactie met gebruikers van generatieve AI's door deze laatste te verbinden met de output van de eerste.
Hogere verwachtingen van eindgebruikers
Als het aankomt op het managen van verwachtingen en de relatie van eindgebruikers met technologie, stelt generatieve AI ons voor een aantal specifieke uitdagingen. Door het vermogen om snel resultaten te produceren, kan generatieve AI bijzonder hoge verwachtingen wekken. Omgekeerd kan het optreden van hallucinaties en ongewenste resultaten het vertrouwen van gebruikers in deze oplossingen sterk ondermijnen.
Generatieve AI is in staat om snel en op een geautomatiseerde manier resultaten te produceren, waardoor eindgebruikers de indruk kunnen krijgen dat de technologie in staat is om al hun problemen onmiddellijk en efficiënt op te lossen. Dit kan leiden tot buitenproportionele verwachtingen over de werkelijke mogelijkheden van generatieve AI, en teleurstelling als de resultaten niet volledig aan deze hoge verwachtingen voldoen.
Generatieve AI is natuurlijk niet perfect en kan soms onverwachte of ongewenste resultaten opleveren, zoals inconsistente, foutieve of ongepaste inhoud. Dergelijke ongewenste resultaten kunnen leiden tot een verlies van vertrouwen in de technologie bij de eindgebruiker, waardoor de betrouwbaarheid en bruikbaarheid in twijfel worden getrokken. Het kan ook leiden tot bezorgdheid over data veiligheid en privacy wanneer onverwachte resultaten de integriteit van informatie die door generatieve AI is gegenereerd, in gevaar brengen.
In februari 2023 gaf Google's chatbot Bard (omgedoopt tot Gemini) onjuiste informatie toen er gevraagd werd naar de ontdekkingen van NASA's James Webb Space Telescope. Het beweerde ten onrechte dat de telescoop de eerste foto's van een exoplaneet had gemaakt. Deze bewering is onjuist, want de eerste foto's van een exoplaneet dateren uit 2004, terwijl de James Webb Telescoop pas in 2021 werd gelanceerd (bron: CNET France team, 2024).
Het is dus cruciaal dat eindgebruikers van generatieve AI-systemen zich bewust zijn van hun beperkingen. Daarom streven de meeste bedrijven die deze oplossingen inzetten ernaar om gebruikers te ondersteunen bij het gebruik ervan: training in de kunst van het vragen, uitleg over de beperkingen van deze systemen, verduidelijken welke verwachtingen wel of niet kunnen worden waargemaakt, en hen herinneren aan de toepasselijke regels met betrekking tot data-bescherming.
Meer dan een jaar na de release van ChatGPT zijn de verwachtingen voor deze nieuwe technologie hooggespannen. De waarde die ermee gepaard gaat, moet zich echter nog concretiseren in tastbare gebruikssituaties. In ons volgende artikel zullen we onderwerpen bespreken die te maken hebben met de adoptie van de technologie door bedrijven en hoe deze zich door de organisatie verspreidt.
Onder leiding van:

BLOG





