Hier volgen enkele richtlijnen om betrouwbare oplossingen voor machinaal leren te bouwen zonder in ethische valkuilen te trappen.
Inleiding
Het gebruik van machinaal leren als middel om beslissingen te nemen is nu alomtegenwoordig geworden. Veel van de resultaten van diensten die we dagelijks gebruiken zijn het resultaat van een beslissing die door machine learning is genomen. Als gevolg hiervan zien we een geleidelijke afname van menselijke tussenkomst op gebieden die elk aspect van ons dagelijks leven beïnvloeden en waar elke fout in het oordeel van het algoritmische model nadelige gevolgen kan hebben. Het is daarom essentieel om goede richtlijnen op te stellen om betrouwbare en verantwoordelijke oplossingen voor machinaal leren te bouwen, waarbij ethiek een belangrijke pijler is.
In de afgelopen jaren heeft ethiek in machinaal leren een aanzienlijke stijging in academisch onderzoek gezien, met grote conferenties zoals FACCT en AIES, maar ook in grote techbedrijven die snelgroeiende teams samenstellen om de ethische uitdagingen aan te gaan.
Ethische AI is een breed onderwerp dat veel onderwerpen omvat, zoals privacy, data governance, maatschappelijk en ecologisch welzijn, algoritmische verantwoordingsplicht, enz. In dit artikel zullen we ons voornamelijk richten op de volgende componenten van ethiek in machinaal leren: eerlijkheid, verklaarbaarheid en traceerbaarheid. We zullen eerst bespreken wat er op het spel staat en waarom aandacht voor ethiek verplicht is, daarna zullen we onderzoeken hoe u uw machine-learningproject kunt opzetten en ontwikkelen met ethiek in gedachten en hoe u ethiek kunt opvolgen zodra het in productie is genomen.
Waarom we aandacht moeten besteden aan ethiek
Nu algoritmen voor machinaal leren en de reeks abstracties en hypothesen die eraan ten grondslag liggen steeds complexer worden, is het een uitdaging geworden om alle mogelijke gevolgen van het hele systeem volledig te begrijpen.
Er zijn verschillende spraakmakende voorbeelden uit de echte wereld van oneerlijke algoritmen voor machinaal leren die leiden tot suboptimale en discriminerende resultaten. Waaronder het bekende voorbeeld van COMPAS. COMPAS was een veelgebruikt commercieel softwareprogramma dat het risico meet dat iemand opnieuw een misdaad begaat, dat werd vergeleken met een normaal menselijk oordeel in een studeren en werd later bevooroordeeld ten opzichte van Afro-Amerikanen: COMPAS kende vaker een hogere risicoscore toe aan Afro-Amerikaanse overtreders dan aan blanken met hetzelfde profiel.
Op het gebied van NLP werd gender biais gedetecteerd in vroege versies van Google Translate dat in 2018 en recenter werd aangepakt.
Op het gebied van krediettoewijzing werd Goldman Sachs onderzocht voor het gebruik van een AI-algoritme dat naar verluidt women discrimineerde door mannen grotere kredietlimieten toe te kennen dan women op hun Apple-kaarten.
Op het gebied van gezondheidszorg heeft een algoritme voor risicovoorspelling, dat gebruikt werd op meer dan 200 miljoen mensen in de VS, raciale vooroordelen aangetoond.
Zonder een duidelijk gedefinieerd kader voor het analyseren, identificeren en beperken van vooroordelen, is het risico om in ethische valkuilen te trappen vrij groot. Het wordt dus steeds belangrijker om goede richtlijnen op te stellen om modellen te bouwen die resultaten produceren die gepast en eerlijk zijn, vooral in domeinen waar mensen bij betrokken zijn. Het bouwen van betrouwbare AI geeft eindgebruikers een veilig gevoel wanneer ze het gebruiken, en het stelt bedrijven in staat om meer controle uit te oefenen over het gebruik ervan om de efficiëntie te verhogen en tegelijkertijd schade te voorkomen. Om ervoor te zorgen dat uw AI betrouwbaar is, moet u eigenlijk al ethisch gaan denken voordat u data verwerkt en algoritmen ontwikkelt.
Hoe u al vóór de start van uw project aan ethiek kunt denken
Ethiek moet vanaf het begin van een nieuw project in overweging worden genomen, vooral in de fase waarin het probleem wordt gedefinieerd. U moet de beoogde eindgebruikers en het doel van de voorgestelde oplossing in gedachten houden om het juiste kader voor analyse en risicobeheer op te stellen om de directe of indirecte schade te identificeren die door de oplossing kan worden veroorzaakt. U moet zich afvragen of mijn oplossing in deze omstandigheden kan leiden tot beslissingen die in het voordeel zijn van een bepaalde subgroep eindgebruikers.
Het is dus van cruciaal belang om KPI's op te stellen om de effectiviteit van uw risicomanagementstrategie te volgen. Een robuust kader kan, indien mogelijk, ook ethische risicobeperkingsmechanismen bevatten.
Als u te maken hebt met een gevoelig onderwerp met een hoog risicopotentieel, is het nodig om meer tijd uit te trekken voor de verkennings- en opbouwfase om een grondige ethische beoordelingsanalyse te kunnen uitvoeren. beperking van vertekeningen strategieën.
U moet ook mechanismen instellen die het voor het AI-systeem gemakkelijker maken om controleerbaarheid en reproduceerbaarheid . Er moet een logische trace beschikbaar zijn voor inspectie, zodat eventuele problemen kunnen worden bekeken of verder onderzocht. Dit wordt gedaan door een goed niveau van traceerbaarheid door documentatie, registratie, tracering en versiebeheer.
Elke data bron en data transformatie moet ook gedocumenteerd worden om de keuzes die gemaakt zijn om de data te verwerken transparant en traceerbaar te maken. Dit maakt het mogelijk om de stappen te lokaliseren die mogelijk een bias hebben geïnjecteerd of versterkt.
Hoe ethiek mee te nemen in de ontwikkeling van uw data project
Om ethiek op te nemen bij het ontwikkelen van uw data project, is het belangrijk om ten minste drie componenten op te nemen: eerlijkheid, uitlegbaarheid en traceerbaarheid.
Eerlijkheid
De eerste stap in de meeste projecten voor machinaal leren is meestal het verzamelen van data. Of u nu het data-verzamelproces doorloopt of een bestaande dataset gebruikt, kennis over hoe de verzameling is uitgevoerd is cruciaal. Meestal is het niet haalbaar om de hele doelpopulatie te omvatten, dus kenmerken en labels kunnen worden bemonsterd uit een subset, gefilterd op bepaalde criteria of geaggregeerd. Al deze stappen kunnen statistische vertekening introduceren die ethische gevolgen kan hebben.
Vooringenomenheid bij vertegenwoordiging
ontstaat door de manier waarop we een populatie definiëren en bemonsteren. Het gebrek aan geografische diversiteit in datasets zoals ImageNet heeft bijvoorbeeld een vertekening naar Westerse landen aangetoond. Als gevolg van steekproefbias, De trends die voor één populatie zijn geschat, zijn mogelijk niet algemeen toepasbaar op data die van een nieuwe populatie is verzameld.

Daarom moeten er geschikte data-afnameprotocollen worden gedefinieerd en moet de diversiteit van de ontvangen data worden geanalyseerd en moeten eventuele lacunes of risico's aan het team worden gerapporteerd. U moet data zo objectief mogelijk verzamelen. Bijvoorbeeld door er door middel van statistische analyse voor te zorgen dat de steekproef representatief is voor de populatie of groep die u bestudeert en door zoveel mogelijk input uit meerdere bronnen te combineren om de diversiteit van de data te waarborgen.
Het documenteren van de bevindingen en het hele data verzamelproces is verplicht.
Er zijn in feite veel mogelijke bronnen van vooringenomenheid die in vele vormen kunnen bestaan, en waarvan sommige kunnen leiden tot oneerlijkheid in verschillende downstream leertaken.
Aangezien de kern van gesuperviseerde algoritmen voor machinaal leren de training data is, kunnen modellen hun gedrag leren van data die kan lijden onder de opname van onbedoelde historische of statistische vooroordelen. Historisch vooroordeel kunnen in het data generatieproces doorsijpelen, zelfs bij een perfecte steekproef en selectie van kenmerken. Het voortbestaan van deze vooroordelen kan leiden tot onbedoelde discriminatie van bepaalde groepen of individuen, wat vooroordelen en marginalisatie kan verergeren.
Niet alle bronnen van vertekening zijn geworteld in data, de volledige pijplijn van machinaal leren omvat een reeks keuzes en praktijken onderweg, van data pre-processing tot modelimplementatie.
Het is niet eenvoudig om vanaf het begin vast te stellen of en hoe problemen kunnen ontstaan. Er is een grondige analyse nodig om eventuele problemen op te sporen. Afhankelijk van de use case, het type data en het doel van de taak, zijn verschillende methoden van toepassing.
In dit gedeelte zullen we een aantal technieken verkennen om ethische bias te identificeren en te beperken aan de hand van een illustratieve use case. We zullen eerst het probleem uiteenzetten, daarna zullen we zien hoe we bias kunnen meten en tot slot zullen we enkele technieken gebruiken om bias te verminderen tijdens pre-processing, in-processing en post-processing.
Probleemstelling
Stel dat u in de banksector een scoringsalgoritme aan het bouwen bent om de targeting van klanten die wel of niet in aanmerking komen voor een premium deal te automatiseren. U krijgt een historische dataset die veel kenmerken bevat over uw zinvolle data over uw klanten, evenals het binaire doel “die in aanmerking komen voor een premium deal”. Elementen van PII (persoonlijk identificeerbare informatie) zijn eerder verwijderd uit de dataset, zodat er geen privacykwesties op het spel staan (wat dit betreft is de google cloud data loss prevention service een geweldig hulpmiddel om de taak van het de-identificeren van uw gevoelige data uit te voeren).
Deze use case lijkt misschien wat fictief, maar het probleem ligt dicht bij een echte use case die we in het verleden in een andere sector hebben behandeld.
Vertekening meten
De eerste stap van de analyse is het verkennen van de data om gevoelige kenmerken, bevoorrechte waarde en het gunstige label te identificeren.
Gevoelige functies (of soms beschermde kenmerken) zijn kenmerken die een populatie onderverdelen in groepen die pariteit zouden moeten hebben in termen van ontvangen voordelen. Deze kenmerken kunnen discriminerend zijn voor bepaalde subgroepen. Bijvoorbeeld: geslacht, geslacht, leeftijd, gezinssituatie, sociaaleconomische classificatie, burgerlijke staat, enz. en alle daarvan afgeleide proxy data (bijv. geografische locatie of factuurbedragen kunnen als proxy voor sociaaleconomische classificatie fungeren omdat in sommige situaties is waargenomen dat ze sterk gecorreleerd kunnen zijn) zijn gevoelige kenmerken.
A geprivilegieerde waarde van een gevoelig kenmerk duidt op een groep die historisch gezien een systematisch voordeel heeft gehad.
A gunstig label Tijdens de voorbereidingsfase van de data kunnen stappen zoals het splitsen van de data, undersampling of oversampling, het omgaan met ontbrekende waarden en uitschieters voor vertekening zorgen als ze niet zorgvuldig worden uitgevoerd. De proporties ontbrekende waarden of uitschieters bij subgroepen op gevoelige kenmerken kan een eerste stap zijn bij het identificeren van vertekening. Sommige imputatiestrategieën kunnen statistische vertekening introduceren, bijvoorbeeld de imputatie van de ontbrekende waarden van het kenmerk leeftijd van de klant door de mediaan ervan.
In ons scorevoorbeeld hebben we de grafiek getekend van hoe de training data is verdeeld over de geslachten met betrekking tot het doel “in aanmerking komen voor een premiedeal”:

We kunnen zien dat de verdeling van het doel onevenwichtig is in het voordeel van het geslacht Mannelijk. Laten we aannemen dat de privilegewaarde Mannelijk waarbij geslacht is een gevoelig kenmerk en het gunstige label is “in aanmerking komend voor een premium deal”. Bovendien kan dit overeenkomen met een vertekening van de vertegenwoordiging in de data. In feite zou men, in een geval waarin de billijkheid gerespecteerd wordt, ervoor kunnen zorgen dat de verdelingen in de data volledig in evenwicht zijn of overeenkomen met de verdelingen in de demografische data.
Op dit punt zou u in de verleiding kunnen komen om gewoon de gevoelige kenmerken uit uw dataset te verwijderen, maar er is aangetoond dat het verwijderen van gevoelige kenmerken niet noodzakelijkerwijs voldoende is om uw model eerlijk te maken. Het model zou andere kenmerken kunnen gebruiken die correleren met het verwijderde gevoelige kenmerk, waardoor historische vertekeningen worden gereproduceerd. Om een voorbeeld te geven: kenmerk A kan sterk gecorreleerd zijn aan de leeftijd van een cliënt, dus als de data bevooroordeeld is ten opzichte van een bepaalde leeftijdsgroep (historische vooringenomenheid kan leiden tot discriminatie op basis van leeftijd bij aanname, promotie etc.), zal deze vooringenomenheid gecodeerd zijn in kenmerk A en zal het verwijderen van de leeftijd van een cliënt het probleem niet verminderen. Door de gevoelige functie in uw data te houden, wanneer dat nodig is, hebt u meer controle over het meten en beperken van vooroordelen en eerlijkheid.
Biasgegevens
Er zijn verschillende definities van eerlijkheid en eerlijkheidsmetriek. We kunnen eerlijkheid onderverdelen in individuele eerlijkheid en groepsrechtvaardigheid. Individuele eerlijkheid geeft gelijksoortige voorspellingen aan gelijksoortige individuen, terwijl groepsrechtvaardigheid verschillende groepen gelijk behandelt.
Om groepsrechtvaardigheid te bereiken, willen we dat de waarschijnlijkheid van een positieve uitkomst hetzelfde is, ongeacht of de persoon in de beschermde groep zit (bijv, vrouw) groep of niet.
Een eenvoudige groepsmeting is het vergelijken van het percentage gunstige uitkomsten voor de bevoorrechte en niet-bevoorrechte groepen (in ons voorbeeld het geslacht Mannelijk die “in aanmerking komen voor een premiedeal” in vergelijking met het geslacht Vrouw die “in aanmerking komen voor een premiedeal”). U kunt deze vergelijking berekenen als een verschil tussen de twee percentages, wat leidt tot de formule statistisch pariteitsverschil metriek (ook wel demografische pariteit):
Opdat er geen verschil zou zijn in gunstige resultaten tussen bevoorrechte en niet-bevoorrechte groepen, moet het statistische pariteitsverschil gelijk zijn aan 0.
Over het onderwerp van individuele eerlijkheidsmetriek is er de consistentie die de mate van gelijkenis van labels voor gelijksoortige individuen meet met behulp van een nearest neighbor-algoritme:

We zullen ons niet op dit onderwerp richten, maar de geïnteresseerde lezer zou dit kunnen controleren artikel.
U kunt de handige bibliotheek AIF360 waarmee u vele eerlijkheidsmetriek kunt berekenen.
Het enige wat u hoeft te doen is uw dataframe in het StandaardDataset. AIF360 gebruikt een StandaardDataset dat een Pandas DataFrame omhult met vele attributen en methoden die specifiek zijn voor het verwerken en meten van ethische vertekeningen. U kunt dit dan gebruiken als invoer voor de BinairLabelDatasetMetric klasse die een set nuttige statistieken zal berekenen.
| params_aif = | |
| # maak aif360 standaardDatasets | |
| trein_standaard_dataset = StandaardDataset(df=trein_dataframe, | |
| **params_aif) | |
| bevoorrechte_groepen = [] | |
| ongeprivilegieerde_groepen = [] | |
| trein_bldm = BinairLabelDatasetMetric(trein_standaard_dataset, | |
| ongeprivilegieerde_groepen=ongeprivilegieerde_groepen, | |
| bevoorrechte_groepen=bevoorrechte_groepen) |
Eenmaal gemeten op de training data van ons scorevoorbeeld, zien we een gemiddeld statistisch pariteitsverschil van -0,21, wat aangeeft dat de bevoorrechte groep Mannelijk had 21% meer positieve resultaten in de trainingsset data.
Beperking van vertekeningen
Methoden die gericht zijn op algoritmische vertekeningen worden gewoonlijk in drie categorieën onderverdeeld:
We gebruikten een voorbewerkingstechniek op de training data om het statistische pariteitsverschil te optimaliseren. We pasten de Herweging algoritme (meer details in deze artikel) die in AIF360 is geïmplementeerd om de voorbeelden in elke combinatie (groep, label) anders te wegen om eerlijkheid voor classificatie te garanderen.
RW = Opnieuw wegen(unprivileged_groups=unprivileged_groups,
privileged_groups=privileged_groups)
herwogen_train = RW.fit_transform(train_standard_dataset)
|
Het kenmerk instance weights is gewijzigd om het gevoelige kenmerk opnieuw in evenwicht te brengen met betrekking tot het doel. Hierdoor wordt de Herweging algoritme verminderde de groepsvooringenomenheid op de training data: een nieuwe maat voor het statistische pariteitsverschil is volledig herschikt van -0,21 naar 0.
Er zijn nog andere algoritmen voor biasvermindering vóór de verwerking geïmplementeerd in AIF360, zoals de DisparateImpactRemover wat een techniek is die de waarden van kenmerken bewerkt om de eerlijkheid van groepen te vergroten terwijl de rangorde binnen groepen behouden blijft (meer informatie in de volgende artikel) of LFR (Leren van eerlijke representatie), wat een voorbewerkingstechniek is die een latente representatie vindt die de data codeert maar informatie over de beschermde attributen verbergt (meer info in het volgende artikel).
Vervolgens hebben we twee classificatiemodellen getraind, één op de oorspronkelijke data en de andere op de herwogen data. We stellen vast dat herweging slechts een zwakke invloed had op de prestaties, met een verlies van 1% van F1-score.
We hebben ook een algoritme voor in-processing uitgeprobeerd op ons voorbeeldgebruik: contradictoire debiatie die de groepsvertekeningsmetriek aanzienlijk verbeterde (het statistische pariteitsverschil werd gedeeld door 2) met weinig verslechtering van de modelprestaties (ongeveer 1% op de F1-score).
Er kan dus een compromis zijn tussen prestatie- en biasmetriek. Hier is de verslechtering vrij klein, maar in sommige situaties kan het compromis acuter zijn. Deze informatie moet aan het licht gebracht worden bij het team en de juiste belanghebbenden, die beslissingen kunnen nemen over hoe met dit probleem om te gaan.
Nu we getrainde modellen hebben, kunnen we hun voorspellingen onderzoeken en nagaan of er geen onevenwicht is in de gunstige uitkomst voor de verschillende geslachten. Er zijn veel hulpmiddelen zoals Wat-als hulpmiddel of Aequitas waarmee u het gedrag van getrainde modellen voor machinaal leren kunt onderzoeken en de modelprestaties en eerlijkheid tussen subgroepen kunt onderzoeken.
Ter illustratie kunt u Aequitas gebruiken om kruistabellen en visualisaties te genereren die verschillende bias- en prestatiecijfers weergeven, verdeeld over de subgroepen. We kunnen bijvoorbeeld snel de true positive percentages vergelijken van de classifiers die getraind zijn op de originele data en op de herwogen data. We zien dat dit percentage gebalanceerd is en daarom meer gendergelijkheid mogelijk maakt voor de gunstige uitkomst van het model om in aanmerking te komen voor een premium deal.

Als nabewerkingstechniek hebben we de classificatiedrempel gebruikt. Een classificatiemodel geeft ons gewoonlijk de waarschijnlijkheid die gepaard gaat met de realisatie van elke klasse als voorspelling. Deze waarschijnlijkheid kan als zodanig worden gebruikt of worden omgezet in een binaire waarde.
Om de klasse te identificeren die overeenkomt met de verkregen waarschijnlijkheden, moet er een classificatiedrempel (ook beslissingsdrempel genoemd) worden gedefinieerd. Elke waarde boven deze drempel komt overeen met de positieve categorie “komt in aanmerking voor een premietransactie” en omgekeerd voor waarden onder deze drempel.
Door de prestatiemeting en de vertekeningsmeting (hier 1 - ongelijke impact) over alle classificatiedrempels uit te zetten, kunnen we de optimale drempel bepalen. Dit helpt ons bij het kiezen van de juiste drempel om de prestatie te maximaliseren en de vertekening te minimaliseren.

Op de linkerfiguur zien we dat als we de drempelwaarde naar links verschuiven, waardoor de prestatie iets lager wordt, we de biasmeting kunnen verbeteren.
Zoals verwacht, zien we ook een duidelijke verbetering van de groepsvooringenomenheid bij het herwogen model (rechter figuur), die nog verder kan worden verbeterd door een andere classificatiedrempel te kiezen, maar dit gaat ten koste van de prestaties.
Verklaarbaarheid
Een andere belangrijke pijler voor het bouwen van betrouwbare modellen voor machinaal leren is de verklaarbaarheid. Uitlegbaarheid is het vermogen om zowel de technische processen van het AI-systeem als de redenering achter de beslissingen of voorspellingen die het AI-systeem maakt, uit te leggen en dus de invloed van elke eigenschap/attribuut op de voorspellingen te kunnen kwantificeren. Het is een goede gewoonte om zoveel mogelijk gebruik te maken van gemakkelijk interpreteerbare modellen in plaats van black-box-modellen.
Er zijn veel methoden om de verklaarbaarheid van modellen te verkrijgen. Deze methoden kunnen gegroepeerd worden in 2 categorieën:
Hier passen we een beroemde post-hocmethode toe, namelijk SHAP (SHapley Additive exPlanations), voor meer informatie raden we aan om te kijken op deze zeer uitgebreide bron over het onderwerp. Shap is een bibliotheek die een speltheoretische benadering implementeert om de uitvoer van eender welk machine-learningmodel te verklaren.
Laten we eens kijken naar de invloed van het Reweighing-algoritme op de verklaarbaarheid van het model:

Korte herinnering over hoe u Shap's moet lezen bijenwarm percelen:
Aan de linkerkant staat de verklaarbaarheid van het oorspronkelijke model, waarbij we zien dat in dit geval de geslachtsvariabele een zeer sterke voorspellende kracht heeft en dat het geslacht Vrouw een invloed heeft op de beslissing om “niet in aanmerking te komen voor een premiedeal”, met een grote kloof met betrekking tot het geslacht Mannelijk.
We kunnen in de rechter grafiek zien, in dit geval waar het model werd getraind op de herwogen data, dat het belang van het geslachtkenmerk sterk is afgenomen. Het behoort nu tot de minst belangrijke kenmerken. Bovendien is de invloed van de vrouwelijke vs. mannelijke klasse op de voorspelling van het doel veel evenwichtiger (de kleuren liggen dicht bij 0 in Shapley-waarde).
Traceerbaarheid
Een ander essentieel aspect in het proces van het creëren van betrouwbare machine-learningalgoritmen is de traceerbaarheid van resultaten en goede reproduceerbaarheid van experimenten. Dit maakt het gemakkelijk om te identificeren welke versie van een model in productie is genomen, zodat het gecontroleerd kan worden als het gedrag schade veroorzaakt en niet langer in overeenstemming is met de ethische waarden van het bedrijf.
Om dit te kunnen doen, moet men elke modelversie en de bijbehorende trainings data, hyperparameters en resultaten kunnen bijhouden en vastleggen. Verschillende hulpmiddelen kunnen deze taak uitvoeren: Mlflow is een geweldige optie waarmee u snel een webinterface kunt genereren die alle runs centraliseert, terwijl u uw artefacten opslaat in de opslag van uw keuze. Elke versie van het experiment kan gevolgd worden met de hash van de bijbehorende commit. Elk van deze versies bevat alle elementen die door MLflow zijn vastgelegd.
Hier is een gereedschap die we op Artefact open source hebben gemaakt, waarmee u met één commando een beveiligde MLflow op een GCP-project kunt implementeren.
Het is ook een goed gebruik om een Factsheet voor elk model, wat overeenkomt met een modelidentiteitskaart die verschillende elementen samenvat, zoals de voorbewerkingsstappen, prestatiemetingen, biasmetingen, enz.
Deze FactSheets worden door de data wetenschappers aan de modeluitvoeringsteams geleverd, zodat zij kunnen bepalen of het model geschikt is voor hun situatie. Voor meer details over de methodologie voor het maken van een FactSheet raden wij u het volgende aan artikel. De FactSheet kan ook worden opgeslagen, bijvoorbeeld in tabelvorm, in MLFlow naast het bijbehorende model.
Hoe volgt u ethiek op nadat u bent ingezet?
Zodra uw model wordt ingezet, moet u ervoor zorgen dat het wordt gebruikt voor het doel waarvoor het is bedacht, ontworpen en gebouwd. Deployment bias treedt op wanneer er een mismatch is tussen het probleem dat een model moet oplossen en de manier waarop het daadwerkelijk wordt gebruikt. Dit gebeurt vaak als een systeem ontwikkeld en geëvalueerd wordt alsof het volledig op zichzelf staat, terwijl het in werkelijkheid deel uitmaakt van een complex socio-technisch systeem dat bestuurd wordt door een groot aantal besluitvormers.
Productie data kan in de loop van de tijd gaan driften, wat kan resulteren in een verslechtering van de algoritmeprestaties waardoor vertekeningen kunnen ontstaan. Het bijhouden van de kwaliteit van de geproduceerde data en de data drift door de distributies van nieuwe data in vergelijking met de data die gebruikt zijn om de modellen te trainen te controleren, moet een stap zijn in de productiepijplijn om indien nodig de juiste waarschuwingen te geven en te bepalen wanneer herscholing verplicht is.
De productiepijplijn moet zo ontworpen zijn dat er een manier is om het huidige model uit te schakelen of terug te gaan naar een vorige versie.
Conclusie
In dit artikel hebben we enkele goede praktijken en protocollen gepresenteerd om u te begeleiden bij het bouwen van machine learning-pijplijnen die het risico om in ethische valkuilen te trappen minimaliseren.
Dit artikel heeft nauwelijks het oppervlak van het enorme onderwerp dat ethische AI is, aangeraakt en slechts een paar van de belangrijkste onderwerpen aangestipt. interessante tools ontwikkeld die nu beschikbaar zijn.
Zoals we gezien hebben, is de meest logische manier om problemen met eerlijkheid expliciet aan te pakken, om een verzameling geselecteerde kenmerken als potentieel discriminerend te bestempelen en vervolgens door dit prisma ethisch vooroordeel te onderzoeken. Deze eenvoudige techniek heeft echter een fout, omdat discriminatie het resultaat kan zijn van een combinatie van kenmerken die op zichzelf niet discriminerend zijn. Bovendien zult u in veel gevallen geen toegang hebben tot gevoelige kenmerken (meer over dit onderwerp hier).
Het beoordelen van eerlijkheid is een complexe taak die afhankelijk is van de aard van het probleem. Het benaderen van een scoringsprobleem op basis van data in tabelvorm zal niet hetzelfde zijn als vooroordelen in natuurlijke taalverwerking beperken.
We hopen dat het delen van onze visie en methodologieën u zal inspireren in uw eigen projecten! Bedankt voor het lezen, aarzel niet om de Artefact tech te volgen blog als u op de hoogte wilt worden gebracht wanneer ons volgende artikel verschijnt!

BLOG






