Artikel geschreven voor de Medium blog door Artefact experts in samenwerking met de Franse Tech Corporate Community.
De overvloed en diversiteit van reacties op ChatGPT en andere generatieve AI's, of ze nu sceptisch of enthousiast zijn, laten de veranderingen zien die ze teweegbrengen en de impact die ze hebben tot ver buiten de gebruikelijke technologiekringen. Dit staat in schril contrast met eerdere generaties van AI, die voornamelijk voorspellend waren en over het algemeen het onderwerp van artikelen of scripties die beperkt bleven tot het domein van onderzoek en innovatie.
Voor bedrijven is generatieve AI ook anders dan eerdere kunstmatige intelligenties. Als we ze vergelijken met de meest vergelijkbare technologieën, zoals natuurlijke taalverwerking (NLP) voor tekstcorpora of computervisie voor audiovisuele data, brengen generatieve AI's vier grote veranderingen met zich mee waarvan bedrijven zich bewust worden naarmate ze ermee experimenteren.
Ten eerste, vergeleken met eerdere AI, versnelt generatief AI de inzet van use cases aanzienlijk in de zin dat het proof of concept versnelt. Ten tweede openen ze een nieuwe wereld van mogelijkheden, waardoor ongestructureerde data gemakkelijker, efficiënter en goedkoper kan worden verbeterd. Bovendien zijn de resultaten die worden verkregen met generatieve AI nieuw in termen van kwaliteit, kwantiteit en diversiteit in vergelijking met de eerder gebruikte modellen. Al deze factoren betekenen dat we moeten inspelen op de verhoogde verwachtingen van eindgebruikers, aangewakkerd door de hype rond deze technologie. We werken deze vier punten hieronder uit.
Generatief AI maakt sneller testen van de toegevoegde waarde van use cases mogelijk
Op het gebied van generatieve AI is de inzet van use cases vaak sneller en minder arbeidsintensief dan bij eerdere AI's. De aanpak van generatieve AI wordt vaak vergeleken met het in elkaar zetten van Lego, waarbij reeds bestaande onderdelen kunnen worden gecombineerd om nieuwe resultaten te creëren. Dit gemak van experimenteren en implementeren kan kortere ontwikkelingscycli mogelijk maken. Daarnaast versnelt een conversatieve interactiemodus met gebruikers ook de adoptie.
Een data use case kan worden gereduceerd tot een bedrijfsprobleem, data, een model en een prompt. Traditioneel is het maken en optimaliseren van het model het meest complexe en tijdrovende deel van het proces. Met generatief AI wordt deze stap eenvoudiger. Generative AI biedt vooraf getrainde, kant-en-klare modellen, waardoor bedrijven kunnen profiteren van geavanceerde expertise zonder veel tijd te hoeven investeren in het ontwikkelen en verfijnen van modellen. In de praktijk zijn modellen (zoals GPT 4.0 van Azure) "on-demand" toegankelijk of kunnen ze worden ingezet via API's (zoals Gemini Pro BARD van Google). Sommige aanbieders bieden zelfs speciaal afgestemde modellen voor specifieke domeinen, zoals het genereren van juridische, medische of financiële teksten.
Zodra het model is ingezet, is de enige taak die overblijft het generatieve AI model te "aarden", d.w.z. de resultaten die door het model worden gegenereerd te verankeren aan informatie uit de echte wereld zodat het model binnen een bepaalde perimeter kan reageren. Dit omvat vaak het toevoegen van beperkingen of aanvullende informatie om het model te leiden naar het produceren van resultaten die coherent en relevant zijn in een specifieke context. Dit staat echter ver af van de tijd die het kost om de AI modellen te trainen die we tot nu toe gebruikten.
Laten we het voorbeeld nemen van een gebruikscase voor verbatim analyse in een callcenter om ons punt te illustreren. Volgens een studie op Artefact duurde het doorgaans drie tot vier weken om dit type use case te ontwikkelen met behulp van modellen op basis van eerdere AI vanaf het moment dat de data werd opgehaald en bruikbaar gemaakt. Vandaag de dag, dankzij generatieve AI, duurt dit proces slechts één week, een versnellingsfactor van meer dan drie. De belangrijkste uitdaging is om de juiste bedrijfsclassificatie te kiezen om het model aan te passen.
Generatief AI breidt de reikwijdte van AI uit naar voorheen weinig gebruikte of verkeerd gebruikte data
Sommige olievelden zijn alleen winstgevend als de olieprijzen de pan uit rijzen. Hetzelfde principe kan worden toegepast op data. Bepaalde ongestructureerde data kunnen nu worden ontgonnen dankzij generatieve AI, wat een heel nieuw veld van exploiteerbare data opent voor het trainen of verfijnen van modellen, en tal van vooruitzichten biedt voor toepassingen die zich specialiseren in specifieke domeinen.
En er is een opkomende belofte: die van generatieve AI's die in staat zijn om elk type data te verwerken en te combineren in hun trainingsprocessen, waarbij het tijdrovende en vervelende werk van het structureren en verbeteren van de kwaliteit van organisatie data wordt overgeslagen om het bruikbaar te maken. Een belofte die op basis van de huidige waarnemingen nog niet is ingelost.
Generatief AI heeft niet alleen geprofiteerd van een echte doorbraak in aandachtsmechanismen. Het heeft ook geprofiteerd van de steeds toenemende - en noodzakelijke - kracht van machines.
Aandachtsmechanismen werken een beetje zoals het vermogen van een persoon om zich te concentreren op een belangrijk deel van een afbeelding of tekst wanneer hij iets probeert te begrijpen of te creëren. Stel je voor dat je een landschap van een foto probeert te tekenen. In plaats van in één keer naar het hele plaatje te kijken, concentreer je je op bepaalde delen die belangrijk lijken, zoals bergen of bomen. Dit helpt je om belangrijke details beter te begrijpen en een nauwkeurigere tekening te maken. Op dezelfde manier zorgen aandachtsmechanismen ervoor dat het model zich kan richten op specifieke delen van een afbeelding of tekst bij het genereren van inhoud. In plaats van alle invoer in één keer te verwerken, kan het model zich richten op de meest relevante en belangrijke delen om nauwkeurigere en betekenisvollere resultaten te produceren. Hierdoor kan het model leren om afbeeldingen, tekst of andere soorten inhoud efficiënter en realistischer te maken.
Aandachtsmechanismen zijn zeer goed te parallelliseren. Het gebruik van meerdere aandachtsmechanismen zorgt voor een rijkere en robuustere representatie van data, wat leidt tot betere prestaties in verschillende taken zoals machinevertaling, tekstgeneratie, spraaksynthese, beeldgeneratie en vele andere.
Hierdoor zijn use cases die nog niet zo lang geleden onmogelijk leken, nu volledig toegankelijk geworden. Dit is bijvoorbeeld het geval bij het berekenen van de spreektijd in de media tijdens presidentiële campagnes. Nog maar twee jaar geleden was het nauwkeurig berekenen van de spreektijd van elke kandidaat een vervelende operatie. Vandaag is het mogelijk, dankzij het gebruik van generatieve AI.
Wat de rekencapaciteiten betreft, heeft OpenAI zes jaar geleden een analyse gepubliceerd waaruit blijkt dat sinds 2012 de hoeveelheid rekenwerk die wordt gebruikt in de belangrijkste AI trainingssessies exponentieel is toegenomen, met een verdubbelingstijd van 3,4 maanden (ter vergelijking: de Wet van Moore had een verdubbelingstijd van twee jaar). Sinds 2012 is deze maatstaf met meer dan 300.000 keer toegenomen (een verdubbeling van twee jaar zou slechts een verzevenvoudiging opleveren).
Generatieve AI modellen vereisen vaak enorme hoeveelheden rekenkracht voor training, vooral omdat de modellen zijn ontworpen om generalistisch te zijn en enorme hoeveelheden inhoud nodig hebben voor training. Krachtige computerbronnen, zoals high-end GPU's of TPU's, zijn nodig om grote datasets te verwerken en complexe optimalisatiealgoritmen uit te voeren. De nieuwe NVIDIA A100 Tensor Core GPU lijkt een ongekende versnelling te bieden. Volgens Nvidia is de A100 services tot 20 keer sneller dan de vorige generatie en kan hij worden gepartitioneerd in zeven GPU-instanties om zich dynamisch aan te passen aan veranderende eisen. Het beschikt naar verluidt ook over de snelste geheugenbandbreedte ter wereld, met meer dan twee terabytes per seconde (TB/s) voor het uitvoeren van de grootste modellen en datasets.
Opgemerkt moet worden dat verbeteringen in computers een belangrijk element zijn geweest in de vooruitgang van artificial intelligence. Zolang deze trend zich voortzet, moeten we voorbereid zijn op de implicaties van systemen die de huidige mogelijkheden ver overtreffen en die de grenzen verder zullen verleggen, waarbij we de waarde van deze systemen moeten afwegen tegen de kosten die ze met zich meebrengen, vooral op het gebied van energie en milieu. We zullen deze punten in een toekomstig artikel bespreken.
Generatief AI verbetert de diversiteit, kwaliteit en kwantiteit van de verkregen resultaten.
Generatief AI verschilt duidelijk van vorige AI door de impact op de resultaten die de modellen genereren. Niet alleen is de hoeveelheid gegenereerde resultaten toegenomen, maar ook hun kwaliteit en diversiteit. Al deze positieve aspecten moeten echter worden getemperd door een lagere reproduceerbaarheid van generatieve AI modellen.
Als we het beeld van een legpuzzel beschouwen, kan data analyse vergeleken worden met het in elkaar zetten ervan, waarbij elk stukje van data een stukje voorstelt dat gerangschikt moet worden om een samenhangend beeld te onthullen. AI speelt een cruciale rol in het proberen in te vullen van de ontbrekende data door de beschikbare informatie te gebruiken om die ontbrekende stukjes af te leiden en opnieuw te maken. Generatief AI gaat verder dan het aanvullen van bestaande data door het creëren van nieuwe data geïnspireerd door wat al bestaat. Dit proces breidt de analysemogelijkheden uit en maakt het mogelijk om nieuwe informatie te ontdekken uit bestaande data, waardoor het generatieve aspect op de voorgrond treedt.
In tegenstelling tot eerdere generaties van AI, die de neiging hebben om resultaten te produceren die vaak op elkaar lijken, zijn generatieve AI modellen in staat om een grotere diversiteit aan resultaten te genereren door verschillende variaties en alternatieven te onderzoeken. Deze grotere diversiteit maakt het mogelijk om rijkere, meer gediversifieerde inhoud te genereren, van kwantitatief naar kwalitatief te gaan en een breder scala aan behoeften en voorkeuren te bestrijken.
OpenAI was onlangs in Hollywood om zijn nieuwste model genaamd "Sora" te laten zien, dat video's kan genereren uit tekst. "Horen dat het al deze dingen kan is één ding, maar het daadwerkelijk zien van de mogelijkheden was verbazingwekkend," zei Hollywood producer Mike Perry, die de diversiteit en kwaliteit van de mogelijkheden van generatieve AI benadrukte.
Door hun vermogen om een bredere ruimte van mogelijkheden te verkennen, kunnen generatieve AI modellen echter minder reproduceerbaar zijn dan eerdere AI's en komt de nauwkeurigheid van de resultaten in het gedrang. Concreet is het moeilijker om telkens als het model wordt uitgevoerd exact dezelfde resultaten te reproduceren, wat uitdagingen kan opleveren op het gebied van betrouwbaarheid en voorspelbaarheid in bepaalde missiekritische toepassingen.
Deze beperking vormt een grote uitdaging voor toepassingen van generatieve AI die precieze antwoorden vereisen. En het is een gebied waar bedrijven aan werken in hun huidige ontwikkelingen: om modellen beter te specialiseren in zeer specifieke domeinen om de nauwkeurigheid van antwoorden te verbeteren, en om de robuustheid van regelgebaseerde modellen of queries op gestructureerde data te combineren met het gebruiksgemak en de interactie met gebruikers van generatieve AI's door deze laatste te verbinden met de output van de eerste.
Hogere verwachtingen van eindgebruikers
Als het gaat om het managen van verwachtingen en de relatie van eindgebruikers tot technologie, stelt generatief AI ons voor een aantal specifieke uitdagingen. Door de mogelijkheid om snel resultaten te produceren, kan generatief AI bijzonder hoge verwachtingen wekken. Omgekeerd kan het optreden van hallucinaties en ongewenste resultaten het vertrouwen van gebruikers in deze oplossingen sterk ondermijnen.
Generatief AI is in staat om snel en op een geautomatiseerde manier resultaten te produceren, wat eindgebruikers de indruk kan geven dat de technologie in staat is om al hun problemen onmiddellijk en efficiënt op te lossen. Dit kan leiden tot buitenproportionele verwachtingen over de werkelijke mogelijkheden van generatief AI, en teleurstelling als de resultaten niet volledig aan deze hoge verwachtingen voldoen.
Generatief AI is natuurlijk niet perfect en kan soms onverwachte of ongewenste resultaten produceren, zoals inconsistente, valse of ongepaste inhoud. Het optreden van dergelijke ongewenste resultaten kan leiden tot een verlies van vertrouwen van de eindgebruiker in de technologie, waardoor de betrouwbaarheid en het nut ervan in twijfel worden getrokken. Het kan ook leiden tot bezorgdheid over data veiligheid en privacy wanneer onverwachte resultaten de integriteit van informatie die door generatieve AI is gegenereerd, in gevaar brengen.
In februari 2023 gaf Google's chatbot Bard (omgedoopt tot Gemini) onjuiste informatie toen hem werd gevraagd naar de ontdekkingen van NASA's James Webb Space Telescope. Het beweerde ten onrechte dat de telescoop de eerste foto's van een exoplaneet had gemaakt. Deze bewering is onjuist, want de eerste foto's van een exoplaneet dateren uit 2004, terwijl de James Webb Telescoop pas in 2021 werd gelanceerd (bron: CNET France team, 2024).
Het is dus cruciaal dat eindgebruikers van generatieve AI systemen zich bewust zijn van hun beperkingen. Daarom streven de meeste bedrijven die deze oplossingen gebruiken ernaar om gebruikers te ondersteunen bij het gebruik ervan: training in de kunst van het vragen stellen, uitleg over de beperkingen van deze systemen, verduidelijken welke verwachtingen wel of niet kunnen worden waargemaakt en hen herinneren aan de geldende regels op het gebied van data bescherming.
Meer dan een jaar na de release van ChatGPT zijn de verwachtingen voor deze nieuwe technologie hooggespannen. De waarde die ermee gepaard gaat, moet zich echter nog concretiseren in concrete use cases. In ons volgende artikel bespreken we onderwerpen die te maken hebben met de adoptie van de technologie door bedrijven en de verspreiding ervan door de organisatie.
Onder leiding van: