Trustworthy AI: new challenges and data-driven solutions

Lees het artikel in het Frans op

De risico's van het massale gebruik van artificial intelligence liggen voornamelijk in de reproductie van menselijke vooroordelen en stereotypen. Om ethische AI te creëren, moeten ontwikkelaars data-driven, betrouwbare AI-oplossingen ontwerpen op een technische, wettelijke en humanistische manier.

Sciencefiction staat vol met verhalen over opstandige AI's, waarbij machines handelen volgens hun eigen snode waardesystemen. Herinnert u zich HAL 9000 in Space Odyssey of Skynet in Terminator? Maar in het echte leven zijn AI-systemen en algoritmen op grote schaal geïntegreerd in alledaagse activiteiten zoals online winkelen, leningen aanvragen of sociale netwerken raadplegen. Hoewel gevallen van afvallige AI gelukkig de fantasie van auteurs blijven, zijn AI-afwijkingen en storingen aan de orde van de dag en hebben ze vaak zeer reële gevolgen.

Stereotypen bestrijden met ethiek

We hebben allemaal de beelden gezien die gegenereerd zijn door AI's zoals Dall-E 2. Het is onschuldig leuk om een afbeelding te maken van een teddybeer die onder water naar muziek luistert. Maar bent u zich ervan bewust dat de algoritmen gebruikt om genderstereotypen te bestendigen door mannen te oververtegenwoordigen in afbeeldingen van dokters, piloten en CEO's, terwijl women oververtegenwoordigd is in afbeeldingen van verpleegsters, stewardessen en secretaresses?

Gezien het enorme aantal dagelijkse beslissingen dat aan AI wordt gedelegeerd, kunnen we de ethische vragen die het gebruik ervan oproept niet negeren. AI blijft een markt en een technologie waarvoor nog steeds weinig wetgeving bestaat (hoewel de Europese Commissie actief werkt aan toekomstige regelgeving). Het is daarom de verantwoordelijkheid van elk individu om gebruikers te beschermen.

De uitdaging voor AI is om betrouwbare systemen te maken door ontwerp die voldoen aan de ethische verwachtingen van onze samenleving. We moeten ons nu al voorbereiden op het ontwerpen en onderhouden van betrouwbare AI-systemen. Dit is een enorme onderneming: ethiek is een onderwerp dat in de hele levenscyclus van een product wordt ingebouwd.

Kunstmatige intelligentie die menselijke fouten reproduceert

Kunstmatige Intelligentie is een verzameling theorieën en technieken die een machine in staat stelt om beslissingen te nemen wanneer deze geconfronteerd wordt met een vooraf gedefinieerde situatie. Met andere woorden, het simuleert menselijke intelligentie. Dergelijke programma's kunnen deterministisch, waarbij opeenvolgende regels worden toegepast volgens een besluitvormingsschema, of probabilistisch, waarbij het programma, na het leren van vergelijkbare situaties uit het verleden, kan afleiden hoe de ‘juiste’ beslissing eruit zou moeten zien. Dit wordt ook wel machinaal leren.

Ongeacht het programmatype is AI de automatisering van besluitvorming. De ethische risico's liggen niet in het feit dat AI slecht kan automatiseren, maar juist in het feit dat het menselijke beslissingen perfect nabootst, met alle fouten en vooroordelen van dien. Veel van deze disfuncties komen voort uit de culturele context waarin de AI is ontwikkeld, wanneer het de historische waardesystemen van een samenleving (bijvoorbeeld gender of etnische ongelijkheid) of die van de ontwerpers (onderwijs, politieke gevoeligheid, religieuze praktijken, enz.) nabootst.

Deze vertekeningen komen vooral voor bij algoritmen voor machinaal leren, omdat ze getraind worden op oude data-bases, waarbij de toekomst uit het verleden wordt afgeleid.

De essentiële vragen die verband houden met het ontwerpen en ontwikkelen van een betrouwbare AI-levenscyclus betreffen zowel technische als ethische kwesties, zoals hoe kunnen mogelijke vertekeningen in een AI betrouwbaar worden opgespoord? Hoe moeten we de resultaten van een model interpreteren? Kunnen we de evolutie van de prestaties van een AI meten? Welke veiligheidsgaranties kunnen we bieden? Kunnen we reageren op een afwijking? Deze niet-uitputtende lijst weerspiegelt de diversiteit van de uitdagingen waaraan tijdens de productie van een AI moet worden voldaan.

AI gebruiken om AI-vooroordelen te corrigeren

Naarmate AI-modellen zich hebben ontwikkeld van concepten tot producten, zijn er veel technische oplossingen gecreëerd om de automatisering en implementatie van AI-systemen te vergemakkelijken. Recentelijk is het aantal beschikbare technische oplossingen geëxplodeerd, waardoor een rijk ecosysteem is ontstaan dat wordt gevoed door constante innovatie van zowel start-ups als industrieleiders. Opmerkelijke voorbeelden zijn de AI Infrastructuur Alliantie en de MLOps Gemeenschap, waarvan Artefact lid is. Het juiste gereedschap voor de juiste taak vinden wordt dus steeds belangrijker en moeilijker.

Tegelijkertijd heeft zich een al even levendig ecosysteem van adviesbureaus ontwikkeld om hun klanten te ondersteunen bij het maken van deze strategische keuzes.

Veel van deze technische oplossingen bestaan in open source en zijn vrij beschikbaar voor iedereen. Deze toolkits kunnen vertekeningen in de hele data verwerkingsketen detecteren en meten: van verzameling tot exploitatie, inclusief transformatie en modellering. Deze oplossingen moeten tijdens de hele levenscyclus van het product geïmplementeerd worden, zowel in de ontwerp- en ontwikkelingsfase als in de productie, om permanente correctie te garanderen. Er zijn drie specifieke gebieden die met technische oplossingen kunnen worden aangepakt.

“Vooroordelen komen niet van data wetenschappers, ze komen van datasets.”

Vooroordelen uit het verleden in AI corrigeren

Vooroordelen ontstaan niet bij data wetenschappers, maar bij datasets. Daarom is het nodig om eerst datasets te onderzoeken en er diep over na te denken. Vertekeningen kunnen zowel technisch (weggelaten variabelen, databasis- of selectieproblemen) als sociaal (economisch, cognitief, emotioneel) zijn.

Om trainingssets te corrigeren, lijkt het misschien logisch om alle sporen van gevoelige data te wissen. Dit zou echter even nutteloos als gevaarlijk zijn: aan de ene kant omdat niet-gevoelige data verraderlijk gecorreleerd kan zijn met gevoelige data, en aan de andere kant omdat dit soort kortere weg aanzet tot het beperken van regelmatige controles op data en processen.

Om deze vertekeningen te detecteren, moet men zich bewust zijn van het bestaan ervan en weten waarnaar men moet zoeken. Het is belangrijk om de context van het data te begrijpen om het correct te kunnen interpreteren. Een enkel programma kan geen vertekeningen opsporen, vandaar het belang van diverse teams van data wetenschappers.

Door kritisch na te denken over de verschillende metrieken die bij een AI-model horen, kunnen we problemen identificeren en corrigeren. Neem een model dat een ziekte moet detecteren die voorkomt bij 1% van de bevolking. Als het model altijd voorspelt dat de persoon gezond is, dan heeft het model een nauwkeurigheid van 99%. Zonder context is dit een uitstekende score. Toch is dit model nutteloos.

Met behulp van basis-, univariate en bivariate dataset-statistieken kunnen enkele vertekeningen geïdentificeerd worden. Is elke leeftijdsgroep bijvoorbeeld wel evenredig vertegenwoordigd? Een oplossing zou kunnen zijn om continue data te veranderen in categorische data. Correlatiematrices kunnen ook verbanden tussen twee gerelateerde variabelen valideren. Al dit voorbereidende werk is cruciaal om ervoor te zorgen dat de modellen worden getraind op kwalitatief goede datasets. In een notendop: “Garbage in, garbage out”.

De resultaten van een model uitleggen

Sterk presterende AI-systemen, zoals kunstmatige neurale netwerken, zijn zeer efficiënt en worden in veel verschillende toepassingen gebruikt. Ze zijn echter moeilijk te interpreteren en daarom worden ze vaak “blackbox-modellen” genoemd. De grote uitdaging van machinaal leren is om de oorzaak van vertekening te identificeren en te verklaren in plaats van de gevolgen ervan te verwerpen. Er is een wisselwerking tussen verklaarbaarheid en nauwkeurigheid. Sommige algoritmen zoals beslisbomen zijn zeer verklaarbaar, maar minder bruikbaar voor complexere voorspellingen.

Het gebied van verklaarbare AI (Ex-AI) probeert dit probleem op te lossen door methoden en algoritmen te ontwikkelen die de verklaarbaarheid van systemen vergroten. Men kan ofwel globaal begrip onderzoeken, dat uitlegt hoe een AI werkt op de globale populatie, of lokaal begrip, dat uitlegt hoe het algoritme werkt op een specifiek voorbeeld. Dit laatste is verplicht volgens de GDPR, want om transparant te zijn moet een AI kunnen uitleggen waarom het model een bepaalde beslissing heeft genomen voor een bepaalde persoon/object/data-regel. Het is belangrijk om naar zowel het globale als het lokale begrip te kijken om te begrijpen hoe het model zich gedraagt.

Om dit te doen, kunnen data wetenschappers kijken naar de significante variabelen van het model. Het is bijvoorbeeld niet normaal voor een wervingsmodel om geslacht als belangrijke variabele te hebben. Ze kunnen ook metrieken controleren zoals nauwkeurigheid (aantal goed voorspelde positieven = juist positief gedeeld door alle voorspelde positieven = juist positief + fout-positief), F1-score (vat de waarden van nauwkeurigheid en terugroepen in een enkele metriek), of terugroepen (aantal goed voorspelde positieven = waar positief gedeeld door alle positieven = waar positief + vals negatief), in relatie tot een variabele (bijv. nauwkeurigheid voor women vs. mannen).

“De grote uitdaging van machinaal leren is om de oorzaak van vooroordelen te identificeren en te verklaren, in plaats van de gevolgen ervan te verwerpen.”

De robuustheid van een model verbeteren

Storingsbronnen in modellen voor kunstmatige intelligentie kunnen onopzettelijk zijn, bijvoorbeeld wanneer data beschadigd is, of opzettelijk, bijvoorbeeld wanneer ze veroorzaakt worden door hackers. Beide bronnen van vooringenomenheid leiden AI-modellen in de fout door onjuiste voorspellingen of resultaten te leveren. Sommige oplossingen maken de evaluatie, verdediging en verificatie van modellen en toepassingen voor machinaal leren mogelijk tegen conflicterende bedreigingen die gericht kunnen zijn op de data (data-poisoning), het model (modellekkage) of de onderliggende infrastructuur, zowel hardware als software.

Foto bron: https://arxiv.org/pdf/1412.6572.pdf

Door simpelweg een ‘ruis’-afbeelding over een normale afbeelding te leggen, kan een classificator een panda verkeerd classificeren als een gibbon. Het verschil is niet waarneembaar voor het menselijk oog, maar deze techniek is goed gedocumenteerd als zijnde in staat om AI-modellen te misleiden.

Minder menselijke, maar meer humanistische systemen ontwikkelen

Het begrip betrouwbare AI kan niet worden gereduceerd tot de juridische en technische conceptie ervan. Menselijke en organisatorische aspecten zijn cruciaal voor het succes van een ethische benadering van AI. Ethische handvesten en verbeteroplossingen moeten bekend zijn bij alle belanghebbenden, toegepast worden tijdens het hele creatieproces en nageleefd worden in de loop der tijd. Dit vereist een transformatie van de organisatiecultuur om ethische kwesties en benaderingen diepgaand te integreren, de duurzaamheid van oplossingen te garanderen en bij te dragen aan ethische AI. door ontwerp.

AI op zich is noch ethisch noch onethisch. Alleen de manier waarop het systeem getraind wordt of hoe het gebruikt wordt, is ethisch of niet. Het echte ethische risico van het massale gebruik van AI is daarom niet dat algoritmen in opstand komen. Integendeel, het risico ontstaat juist wanneer AI zich precies zo gedraagt als wij het hebben gevraagd, onze vooroordelen nabootst, onze fouten herhaalt en onze onzekerheden en onnauwkeurigheden versterkt.

“Het risico ontstaat juist wanneer AI zich precies zo gedraagt als wij het hebben gevraagd.”

Proactief zijn op het gebied van ethische AI

Dit onderwerp ligt ons na aan het hart bij Artefact, Daarom hebben we er teams aan gewijd en specifieke ondersteuning ontwikkeld voor de ontwikkeling van governance, de implementatie van technische oplossingen en advies over AI-strategie.

We werken nauw samen met de academische wereld, als partner van de Goed in techniek leerstoel, mede opgericht door het Institut Mines-Télécom en Sciences Po, om de kloof tussen onderzoek en praktijk te verkleinen. Artefact heeft ook het label Responsible and Trusted AI ontvangen, uitgereikt door de onafhankelijke vereniging Labelia-labs, Dit garandeert een hoge mate van volwassenheid op het gebied van verantwoorde en betrouwbare AI.

De kwestie van ethiek gaat ons allemaal aan, en het is essentieel om proactief te zijn op dit gebied; het aannemen van ethisch gedrag mag niet slechts een reactie zijn. Kunstmatige intelligentie maakt een evolutieve periode door, waarin haar processen en ethos nog gedefinieerd moeten worden. Op een gebied dat nog niet gereguleerd is, is het aan degenen die een actieve rol spelen om het voortouw te nemen. Als ontwikkelaars, consultants en managers is het onze verantwoordelijkheid om aan de verwachtingen van alle betrokkenen te voldoen - niet alleen van klanten en gebruikers van diensten, maar ook van de maatschappij in het algemeen - en om de kracht van AI te gebruiken om een betere wereld te creëren.

Neem contact met ons op

Betrouwbare AI: nieuwe uitdagingen en data-driven oplossingen