{"id":61815,"date":"2021-07-27T16:15:44","date_gmt":"2021-07-27T15:15:44","guid":{"rendered":"https:\/\/www.artefact.com\/?post_type=news&#038;p=61815"},"modified":"2024-09-20T17:45:46","modified_gmt":"2024-09-20T16:45:46","slug":"including-ethics-best-practices-in-your-data-science-project-from-day-one","status":"publish","type":"blog","link":"https:\/\/www.artefact.com\/nl\/blog\/including-ethics-best-practices-in-your-data-science-project-from-day-one\/","title":{"rendered":"Beste praktijken voor ethiek vanaf de eerste dag opnemen in uw Data wetenschapsproject"},"content":{"rendered":"<p><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling article-author\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-background-color:#ffffff;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_2 1_2 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:50%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:50%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-1 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Auteur<\/h2><\/div><img decoding=\"async\" src=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27150%27%20height%3D%270%27%20viewBox%3D%270%200%20150%200%27%3E%3Crect%20width%3D%27150%27%20height%3D%270%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/02\/Karim-e1614443653963.png\" alt=\"Image\" class=\"lazyload artefact-elegant-image align-left article-author-image\" style=\"width: 150px; border-radius: 54% 46% 77% 23% \/ 74% 40% 60% 26%; overflow: hidden;\" width=\"150\" height=\"auto\" \/><div class=\"fusion-title title fusion-title-2 fusion-sep-none fusion-title-text fusion-title-size-three article-author-name-title\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Karim Si Larbi<\/h3><\/div><div class=\"fusion-text fusion-text-1 article-author-description\"><p>Senior Data Wetenschapper bij Artefact<\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-2 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-1 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-text fusion-text-2 description\"><p>Hier volgen enkele richtlijnen om betrouwbare oplossingen voor machinaal leren te bouwen zonder in ethische valkuilen te trappen.<\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-3 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-margin-top:40px;--awb-margin-bottom:40px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-center fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-2 fusion_builder_column_1_1 1_1 fusion-flex-column fusion-flex-align-self-center fusion-column-inner-bg-wrapper\" style=\"--awb-padding-top:20px;--awb-padding-right:20px;--awb-padding-bottom:20px;--awb-padding-left:20px;--awb-overflow:hidden;--awb-inner-bg-size:cover;--awb-border-color:rgba(10,17,40,0.1);--awb-border-top:1px;--awb-border-right:1px;--awb-border-bottom:1px;--awb-border-left:1px;--awb-border-style:solid;--awb-border-radius:4px 4px 4px 4px;--awb-inner-bg-border-radius:4px 4px 4px 4px;--awb-inner-bg-overflow:hidden;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><span class=\"fusion-column-inner-bg hover-type-none\"><a class=\"fusion-column-anchor\" href=\"https:\/\/\/nl\/&\/#47;&#x2f;&#109;&#x65;&#100;&#x69;u&#x6d;&#46;&#x63;o&#109;&#x2f;&#64;&#x6b;&#97;&#x72;&#105;&#x6d;&#46;&#x73;i&#x6c;a&#114;&#x62;&#105;?p=c15b26c2bf99\" rel=\"noopener noreferrer\" target=\"_blank\"><span class=\"fusion-column-inner-bg-image\"><\/span><\/a><\/span><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-center fusion-content-layout-row fusion-flex-align-items-center\"><div class=\"fusion-text fusion-text-3\"><p><u>Lees ons artikel over<\/u><\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-margin-right:20px;--awb-margin-left:20px;--awb-max-width:150px;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-1 hover-type-none\"><img decoding=\"async\" width=\"72\" height=\"41\" title=\"middelgrote\" src=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%2772%27%20height%3D%2741%27%20viewBox%3D%270%200%2072%2041%27%3E%3Crect%20width%3D%2772%27%20height%3D%2741%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/medium.png\" alt class=\"lazyload img-responsive wp-image-60927\"\/><\/span><\/div><div class=\"fusion-text fusion-text-4\"><p>.<\/p>\n<\/div><\/div><\/div><\/div><\/div><article class=\"fusion-fullwidth fullwidth-box fusion-builder-row-4 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-3 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-3 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Inleiding<\/h2><\/div><div class=\"fusion-text fusion-text-5\"><p>Het gebruik van machinaal leren als middel om beslissingen te nemen is nu alomtegenwoordig geworden. Veel van de resultaten van diensten die we dagelijks gebruiken zijn het resultaat van een beslissing die door machine learning is genomen. Als gevolg hiervan zien we een geleidelijke afname van menselijke tussenkomst op gebieden die elk aspect van ons dagelijks leven be\u00efnvloeden en waar elke fout in het oordeel van het algoritmische model nadelige gevolgen kan hebben. Het is daarom essentieel om goede richtlijnen op te stellen om betrouwbare en verantwoordelijke oplossingen voor machinaal leren te bouwen, waarbij ethiek een belangrijke pijler is.<\/p>\n<\/div><div class=\"fusion-text fusion-text-6\"><p>In de afgelopen jaren heeft ethiek in machinaal leren een aanzienlijke stijging in academisch onderzoek gezien, met grote conferenties zoals\u00a0<a class=\"ds iu\" href=\"https:\/\/facctconference.org\/index.html\" rel=\"noopener nofollow\" target=\"_blank\">FACCT<\/a>\u00a0en\u00a0<a class=\"ds iu\" href=\"https:\/\/www.aies-conference.com\/2021\/\" rel=\"noopener nofollow\" target=\"_blank\">AIES<\/a>, maar ook in grote techbedrijven die snelgroeiende teams samenstellen om de ethische uitdagingen aan te gaan.<\/p>\n<\/div><div class=\"fusion-text fusion-text-7\"><p>Ethische AI is een breed onderwerp dat veel onderwerpen omvat, zoals privacy, data governance, maatschappelijk en ecologisch welzijn, algoritmische verantwoordingsplicht, enz. In dit artikel zullen we ons voornamelijk richten op de volgende componenten van ethiek in machinaal leren:\u00a0<strong>eerlijkheid, verklaarbaarheid en traceerbaarheid<\/strong>. We zullen eerst bespreken wat er op het spel staat en waarom aandacht voor ethiek verplicht is, daarna zullen we onderzoeken hoe u uw machine-learningproject kunt opzetten en ontwikkelen met ethiek in gedachten en hoe u ethiek kunt opvolgen zodra het in productie is genomen.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-4 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Waarom we aandacht moeten besteden aan ethiek<\/h2><\/div><div class=\"fusion-text fusion-text-8\"><p>Nu algoritmen voor machinaal leren en de reeks abstracties en hypothesen die eraan ten grondslag liggen steeds complexer worden, is het een uitdaging geworden om alle mogelijke gevolgen van het hele systeem volledig te begrijpen.<br \/>\nEr zijn verschillende spraakmakende voorbeelden uit de echte wereld van oneerlijke algoritmen voor machinaal leren die leiden tot suboptimale en discriminerende resultaten. Waaronder het bekende voorbeeld van COMPAS. COMPAS was een veelgebruikt commercieel softwareprogramma dat het risico meet dat iemand opnieuw een misdaad begaat, dat werd vergeleken met een normaal menselijk oordeel in een\u00a0<a class=\"ds iu\" href=\"https:\/\/www.propublica.org\/article\/machine-bias-risk-assessments-in-criminal-sentencing\" rel=\"noopener nofollow\" target=\"_blank\">studeren<\/a>\u00a0en werd later bevooroordeeld ten opzichte van Afro-Amerikanen: COMPAS kende vaker een hogere risicoscore toe aan Afro-Amerikaanse overtreders dan aan blanken met hetzelfde profiel.<\/p>\n<\/div><div class=\"fusion-text fusion-text-9\"><p>Op het gebied van NLP werd gender biais gedetecteerd in vroege versies van Google Translate dat in 2018 en recenter werd aangepakt.<\/p>\n<p>Op het gebied van krediettoewijzing werd Goldman Sachs onderzocht voor het gebruik van een AI-algoritme dat naar verluidt women discrimineerde door mannen grotere kredietlimieten toe te kennen dan women op hun Apple-kaarten.<\/p>\n<p>Op het gebied van gezondheidszorg heeft een algoritme voor risicovoorspelling, dat gebruikt werd op meer dan 200 miljoen mensen in de VS, raciale vooroordelen aangetoond.<\/p>\n<\/div><div class=\"fusion-text fusion-text-10\"><p>Zonder een duidelijk gedefinieerd kader voor het analyseren, identificeren en beperken van vooroordelen, is het risico om in ethische valkuilen te trappen vrij groot. Het wordt dus steeds belangrijker om goede richtlijnen op te stellen om modellen te bouwen die resultaten produceren die gepast en eerlijk zijn, vooral in domeinen waar mensen bij betrokken zijn. Het bouwen van betrouwbare AI geeft eindgebruikers een veilig gevoel wanneer ze het gebruiken, en het stelt bedrijven in staat om meer controle uit te oefenen over het gebruik ervan om de effici\u00ebntie te verhogen en tegelijkertijd schade te voorkomen.\u00a0<strong>Om ervoor te zorgen dat uw AI betrouwbaar is, moet u eigenlijk al ethisch gaan denken voordat u data verwerkt en algoritmen ontwikkelt.<\/strong><\/p>\n<\/div><div class=\"fusion-title title fusion-title-5 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Hoe u al v\u00f3\u00f3r de start van uw project aan ethiek kunt denken<\/h2><\/div><div class=\"fusion-text fusion-text-11\"><p><strong>Ethiek moet vanaf het begin van een nieuw project in overweging worden genomen, vooral in de fase waarin het probleem wordt gedefinieerd. U moet de beoogde eindgebruikers en het doel van de voorgestelde oplossing in gedachten houden om het juiste kader voor analyse en risicobeheer op te stellen om de directe of indirecte schade te identificeren die door de oplossing kan worden veroorzaakt.<\/strong>\u00a0U moet zich afvragen of mijn oplossing in deze omstandigheden kan leiden tot beslissingen die in het voordeel zijn van een bepaalde subgroep eindgebruikers.<\/p>\n<\/div><div class=\"fusion-text fusion-text-12\"><p>Het is dus van cruciaal belang om KPI's op te stellen om de effectiviteit van uw risicomanagementstrategie te volgen. Een robuust kader kan, indien mogelijk, ook ethische risicobeperkingsmechanismen bevatten.<br \/>\nAls u te maken hebt met een gevoelig onderwerp met een hoog risicopotentieel, is het nodig om meer tijd uit te trekken voor de verkennings- en opbouwfase om een grondige ethische beoordelingsanalyse te kunnen uitvoeren.\u00a0<strong>beperking van vertekeningen<\/strong>\u00a0strategie\u00ebn.<\/p>\n<\/div><div class=\"fusion-text fusion-text-13\"><p>U moet ook mechanismen instellen die het voor het AI-systeem gemakkelijker maken om\u00a0<strong>controleerbaarheid<\/strong>\u00a0en\u00a0<strong> reproduceerbaarheid <\/strong>. Er moet een logische trace beschikbaar zijn voor inspectie, zodat eventuele problemen kunnen worden bekeken of verder onderzocht. Dit wordt gedaan door een goed niveau van\u00a0<strong>traceerbaarheid<\/strong>\u00a0door documentatie, registratie, tracering en versiebeheer.<\/p>\n<p>Elke data bron en data transformatie moet ook gedocumenteerd worden om de keuzes die gemaakt zijn om de data te verwerken transparant en traceerbaar te maken. Dit maakt het mogelijk om de stappen te lokaliseren die mogelijk een bias hebben ge\u00efnjecteerd of versterkt.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-6 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Hoe ethiek mee te nemen in de ontwikkeling van uw data project<\/h2><\/div><div class=\"fusion-text fusion-text-14\"><p>Om ethiek op te nemen bij het ontwikkelen van uw data project, is het belangrijk om ten minste drie componenten op te nemen: eerlijkheid, uitlegbaarheid en traceerbaarheid.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-7 fusion-sep-none fusion-title-text fusion-title-size-three\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Eerlijkheid<\/h3><\/div><div class=\"fusion-text fusion-text-15\"><p>De eerste stap in de meeste projecten voor machinaal leren is meestal het verzamelen van data. Of u nu het data-verzamelproces doorloopt of een bestaande dataset gebruikt, kennis over hoe de verzameling is uitgevoerd is cruciaal. Meestal is het niet haalbaar om de hele doelpopulatie te omvatten, dus kenmerken en labels kunnen worden bemonsterd uit een subset, gefilterd op bepaalde criteria of geaggregeerd. Al deze stappen kunnen statistische vertekening introduceren die ethische gevolgen kan hebben.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-8 fusion-sep-none fusion-title-text fusion-title-size-three\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Vooringenomenheid bij vertegenwoordiging<\/h3><\/div><div class=\"fusion-text fusion-text-16\"><p>ontstaat door de manier waarop we een populatie defini\u00ebren en bemonsteren. Het gebrek aan geografische diversiteit in datasets zoals ImageNet heeft bijvoorbeeld een vertekening naar Westerse landen aangetoond. Als gevolg van\u00a0<strong>steekproefbias<\/strong>, De trends die voor \u00e9\u00e9n populatie zijn geschat, zijn mogelijk niet algemeen toepasbaar op data die van een nieuwe populatie is verzameld.<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-2 hover-type-none\"><img decoding=\"async\" width=\"700\" height=\"594\" title=\"Artikel-Inclusief-ethiek\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/Article-Including-ethics.jpeg\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/Article-Including-ethics.jpeg\" alt class=\"lazyload img-responsive wp-image-61822\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27700%27%20height%3D%27594%27%20viewBox%3D%270%200%20700%20594%27%3E%3Crect%20width%3D%27700%27%20height%3D%27594%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/Article-Including-ethics-200x170.jpeg 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/Article-Including-ethics-400x339.jpeg 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/Article-Including-ethics-600x509.jpeg 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/Article-Including-ethics.jpeg 700w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 700px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-17\"><p>Daarom moeten er geschikte data-afnameprotocollen worden gedefinieerd en moet de diversiteit van de ontvangen data worden geanalyseerd en moeten eventuele lacunes of risico's aan het team worden gerapporteerd. U moet data zo objectief mogelijk verzamelen. Bijvoorbeeld door er door middel van statistische analyse voor te zorgen dat de steekproef representatief is voor de populatie of groep die u bestudeert en door zoveel mogelijk input uit meerdere bronnen te combineren om de diversiteit van de data te waarborgen.<br \/>\nHet documenteren van de bevindingen en het hele data verzamelproces is verplicht.<\/p>\n<\/div><div class=\"fusion-text fusion-text-18\"><p>Er zijn in feite veel mogelijke bronnen van vooringenomenheid die in vele vormen kunnen bestaan, en waarvan sommige kunnen leiden tot oneerlijkheid in verschillende downstream leertaken.<br \/>\nAangezien de kern van gesuperviseerde algoritmen voor machinaal leren de training data is, kunnen modellen hun gedrag leren van data die kan lijden onder de opname van onbedoelde historische of statistische vooroordelen.\u00a0<strong>Historisch vooroordeel<\/strong>\u00a0kunnen in het data generatieproces doorsijpelen, zelfs bij een perfecte steekproef en selectie van kenmerken. Het voortbestaan van deze vooroordelen kan leiden tot onbedoelde discriminatie van bepaalde groepen of individuen, wat vooroordelen en marginalisatie kan verergeren.<\/p>\n<\/div><div class=\"fusion-text fusion-text-19\"><p>Niet alle bronnen van vertekening zijn geworteld in data, de volledige pijplijn van machinaal leren omvat een reeks keuzes en praktijken onderweg, van data pre-processing tot modelimplementatie.<br \/>\nHet is niet eenvoudig om vanaf het begin vast te stellen of en hoe problemen kunnen ontstaan. Er is een grondige analyse nodig om eventuele problemen op te sporen. Afhankelijk van de use case, het type data en het doel van de taak, zijn verschillende methoden van toepassing.<br \/>\nIn dit gedeelte zullen we een aantal technieken verkennen om ethische bias te identificeren en te beperken aan de hand van een illustratieve use case. We zullen eerst het probleem uiteenzetten, daarna zullen we zien hoe we bias kunnen meten en tot slot zullen we enkele technieken gebruiken om bias te verminderen tijdens pre-processing, in-processing en post-processing.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-9 fusion-sep-none fusion-title-text fusion-title-size-four\" style=\"--awb-margin-bottom-small:8px;\"><h4 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Probleemstelling<\/h4><\/div><div class=\"fusion-text fusion-text-20\"><p>Stel dat u in de banksector een scoringsalgoritme aan het bouwen bent om de targeting van klanten die wel of niet in aanmerking komen voor een premium deal te automatiseren. U krijgt een historische dataset die veel kenmerken bevat over uw zinvolle data over uw klanten, evenals het binaire doel \u201cdie in aanmerking komen voor een premium deal\u201d. Elementen van PII (persoonlijk identificeerbare informatie) zijn eerder verwijderd uit de dataset, zodat er geen privacykwesties op het spel staan (wat dit betreft is de google cloud data loss prevention service een geweldig hulpmiddel om de taak van het de-identificeren van uw gevoelige data uit te voeren).<br \/>\nDeze use case lijkt misschien wat fictief, maar het probleem ligt dicht bij een echte use case die we in het verleden in een andere sector hebben behandeld.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-10 fusion-sep-none fusion-title-text fusion-title-size-four\" style=\"--awb-margin-bottom-small:8px;\"><h4 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Vertekening meten<\/h4><\/div><div class=\"fusion-text fusion-text-21\"><p>De eerste stap van de analyse is het verkennen van de data om gevoelige kenmerken, bevoorrechte waarde en het gunstige label te identificeren.<\/p>\n<p><strong>Gevoelige functies\u00a0<\/strong>(of soms\u00a0<strong>beschermde kenmerken<\/strong>) zijn kenmerken die een populatie onderverdelen in groepen die pariteit zouden moeten hebben in termen van ontvangen voordelen. Deze kenmerken kunnen discriminerend zijn voor bepaalde subgroepen. Bijvoorbeeld: geslacht, geslacht, leeftijd, gezinssituatie, sociaaleconomische classificatie, burgerlijke staat, enz. en alle daarvan afgeleide proxy data (bijv. geografische locatie of factuurbedragen kunnen als proxy voor sociaaleconomische classificatie fungeren omdat in sommige situaties is waargenomen dat ze sterk gecorreleerd kunnen zijn) zijn gevoelige kenmerken.<\/p>\n<p>A<strong> geprivilegieerde waarde<\/strong>\u00a0van een gevoelig kenmerk duidt op een groep die historisch gezien een systematisch voordeel heeft gehad.<\/p>\n<\/div><div class=\"fusion-text fusion-text-22\"><p>A <strong>gunstig label<\/strong>\u00a0Tijdens de voorbereidingsfase van de data kunnen stappen zoals het splitsen van de data, undersampling of oversampling, het omgaan met ontbrekende waarden en uitschieters voor vertekening zorgen als ze niet zorgvuldig worden uitgevoerd. De proporties ontbrekende waarden of uitschieters bij subgroepen op gevoelige kenmerken kan een eerste stap zijn bij het identificeren van vertekening. Sommige imputatiestrategie\u00ebn kunnen statistische vertekening introduceren, bijvoorbeeld de imputatie van de ontbrekende waarden van het kenmerk leeftijd van de klant door de mediaan ervan.<\/p>\n<p>In ons scorevoorbeeld hebben we de grafiek getekend van hoe de training data is verdeeld over de geslachten met betrekking tot het doel \u201cin aanmerking komen voor een premiedeal\u201d:<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-3 hover-type-none\"><img decoding=\"async\" width=\"700\" height=\"324\" title=\"karim-si-larbi-blog\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/karim-si-larbi-blog.png\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/karim-si-larbi-blog.png\" alt class=\"lazyload img-responsive wp-image-61823\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27700%27%20height%3D%27324%27%20viewBox%3D%270%200%20700%20324%27%3E%3Crect%20width%3D%27700%27%20height%3D%27324%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/karim-si-larbi-blog-200x93.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/karim-si-larbi-blog-400x185.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/karim-si-larbi-blog-600x278.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/karim-si-larbi-blog.png 700w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 700px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-23\"><p>We kunnen zien dat de verdeling van het doel onevenwichtig is in het voordeel van het geslacht\u00a0<em>Mannelijk<\/em>. Laten we aannemen dat de privilegewaarde\u00a0<em>Mannelijk<\/em>\u00a0waarbij\u00a0<em>geslacht<\/em> is een gevoelig kenmerk en het gunstige label is \u201cin aanmerking komend voor een premium deal\u201d. Bovendien kan dit overeenkomen met een vertekening van de vertegenwoordiging in de data. In feite zou men, in een geval waarin de billijkheid gerespecteerd wordt, ervoor kunnen zorgen dat de verdelingen in de data volledig in evenwicht zijn of overeenkomen met de verdelingen in de demografische data.<\/p>\n<p>Op dit punt zou u in de verleiding kunnen komen om gewoon de gevoelige kenmerken uit uw dataset te verwijderen, maar er is aangetoond dat het verwijderen van gevoelige kenmerken niet noodzakelijkerwijs voldoende is om uw model eerlijk te maken. Het model zou andere kenmerken kunnen gebruiken die correleren met het verwijderde gevoelige kenmerk, waardoor historische vertekeningen worden gereproduceerd. Om een voorbeeld te geven: kenmerk A kan sterk gecorreleerd zijn aan de leeftijd van een cli\u00ebnt, dus als de data bevooroordeeld is ten opzichte van een bepaalde leeftijdsgroep (historische vooringenomenheid kan leiden tot discriminatie op basis van leeftijd bij aanname, promotie etc.), zal deze vooringenomenheid gecodeerd zijn in kenmerk A en zal het verwijderen van de leeftijd van een cli\u00ebnt het probleem niet verminderen. Door de gevoelige functie in uw data te houden, wanneer dat nodig is, hebt u meer controle over het meten en beperken van vooroordelen en eerlijkheid.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-11 fusion-sep-none fusion-title-text fusion-title-size-four\" style=\"--awb-margin-bottom-small:8px;\"><h4 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Biasgegevens<\/h4><\/div><div class=\"fusion-text fusion-text-24\"><p>Er zijn verschillende definities van eerlijkheid en eerlijkheidsmetriek. We kunnen eerlijkheid onderverdelen in\u00a0<strong>individuele eerlijkheid<\/strong>\u00a0en\u00a0<strong>groepsrechtvaardigheid<\/strong>. Individuele eerlijkheid geeft gelijksoortige voorspellingen aan gelijksoortige individuen, terwijl groepsrechtvaardigheid verschillende groepen gelijk behandelt.<\/p>\n<p>Om groepsrechtvaardigheid te bereiken, willen we dat de waarschijnlijkheid van een positieve uitkomst hetzelfde is, ongeacht of de persoon in de beschermde groep zit (bijv,\u00a0<em>vrouw<\/em>) groep of niet.<br \/>\nEen eenvoudige groepsmeting is het vergelijken van het percentage gunstige uitkomsten voor de bevoorrechte en niet-bevoorrechte groepen (in ons voorbeeld het geslacht\u00a0<em>Mannelijk<\/em>\u00a0die \u201cin aanmerking komen voor een premiedeal\u201d in vergelijking met het geslacht\u00a0<em>Vrouw<\/em>\u00a0die \u201cin aanmerking komen voor een premiedeal\u201d). U kunt deze vergelijking berekenen als een verschil tussen de twee percentages, wat leidt tot de formule\u00a0<strong>statistisch pariteitsverschil<\/strong>\u00a0metriek (ook wel\u00a0<strong>demografische pariteit<\/strong>):<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-4 hover-type-none\"><img decoding=\"async\" width=\"700\" height=\"17\" title=\"code-blog-Karim\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/code-blog-Karim.png\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/code-blog-Karim.png\" alt class=\"lazyload img-responsive wp-image-61828\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27700%27%20height%3D%2717%27%20viewBox%3D%270%200%20700%2017%27%3E%3Crect%20width%3D%27700%27%20height%3D%2717%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/code-blog-Karim-200x5.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/code-blog-Karim-400x10.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/code-blog-Karim-600x15.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/code-blog-Karim.png 700w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 700px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-25\"><p>Opdat er geen verschil zou zijn in gunstige resultaten tussen bevoorrechte en niet-bevoorrechte groepen, moet het statistische pariteitsverschil gelijk zijn aan 0.<br \/>\nOver het onderwerp van individuele eerlijkheidsmetriek is er de\u00a0<strong>consistentie<\/strong>\u00a0die de mate van gelijkenis van labels voor gelijksoortige individuen meet met behulp van een nearest neighbor-algoritme:<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-5 hover-type-none\"><img decoding=\"async\" width=\"700\" height=\"75\" title=\"blog-karim\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-karim.png\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-karim.png\" alt class=\"lazyload img-responsive wp-image-61829\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27700%27%20height%3D%2775%27%20viewBox%3D%270%200%20700%2075%27%3E%3Crect%20width%3D%27700%27%20height%3D%2775%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-karim-200x21.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-karim-400x43.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-karim-600x64.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-karim.png 700w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 700px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-26\"><p>We zullen ons niet op dit onderwerp richten, maar de ge\u00efnteresseerde lezer zou dit kunnen controleren\u00a0<a class=\"ds iu\" href=\"http:\/\/proceedings.mlr.press\/v28\/zemel13.pdf\" rel=\"noopener nofollow\" target=\"_blank\">artikel<\/a>.<br \/>\nU kunt de handige bibliotheek\u00a0<a class=\"ds iu\" href=\"https:\/\/github.com\/Trusted-AI\/AIF360\" rel=\"noopener nofollow\" target=\"_blank\">AIF360<\/a>\u00a0waarmee u vele eerlijkheidsmetriek kunt berekenen.<br \/>\nHet enige wat u hoeft te doen is uw dataframe in het\u00a0<em>StandaardDataset<\/em>. AIF360 gebruikt een\u00a0<em>StandaardDataset<\/em>\u00a0dat een Pandas DataFrame omhult met vele attributen en methoden die specifiek zijn voor het verwerken en meten van ethische vertekeningen. U kunt dit dan gebruiken als invoer voor de\u00a0<em>BinairLabelDatasetMetric<\/em> klasse die een set nuttige statistieken zal berekenen.<\/p>\n<\/div><div class=\"fusion-text fusion-text-27\"><div class=\"code\">\n<table class=\"highlight tab-size js-file-line-container\" data-tab-size=\"8\" data-paste-markdown-skip=\"\">\n<tbody>\n<tr>\n<td id=\"file-gist_for_medium_article-py-LC1\" class=\"blob-code blob-code-inner js-file-line\"><span class=\"pl-s1\">params_aif<\/span> <span class=\"pl-c1\">=<\/span> <\/td>\n<\/tr>\n<tr>\n<td id=\"file-gist_for_medium_article-py-L7\" class=\"blob-num js-line-number\" data-line-number=\"7\"><\/td>\n<td id=\"file-gist_for_medium_article-py-LC7\" class=\"blob-code blob-code-inner js-file-line\"><\/td>\n<\/tr>\n<tr>\n<td id=\"file-gist_for_medium_article-py-L8\" class=\"blob-num js-line-number\" data-line-number=\"8\"><\/td>\n<td id=\"file-gist_for_medium_article-py-LC8\" class=\"blob-code blob-code-inner js-file-line\"><span class=\"pl-c\"># maak aif360 standaardDatasets<\/span><\/td>\n<\/tr>\n<tr>\n<td id=\"file-gist_for_medium_article-py-L9\" class=\"blob-num js-line-number\" data-line-number=\"9\"><\/td>\n<td id=\"file-gist_for_medium_article-py-LC9\" class=\"blob-code blob-code-inner js-file-line\"><span class=\"pl-s1\">trein_standaard_dataset<\/span> <span class=\"pl-c1\">=<\/span> <span class=\"pl-v\">StandaardDataset<\/span>(<span class=\"pl-s1\">df<\/span><span class=\"pl-c1\">=<\/span><span class=\"pl-s1\">trein_dataframe<\/span>,<\/td>\n<\/tr>\n<tr>\n<td id=\"file-gist_for_medium_article-py-L10\" class=\"blob-num js-line-number\" data-line-number=\"10\"><\/td>\n<td id=\"file-gist_for_medium_article-py-LC10\" class=\"blob-code blob-code-inner js-file-line\"><span class=\"pl-c1\">**<\/span><span class=\"pl-s1\">params_aif<\/span>)<\/td>\n<\/tr>\n<tr>\n<td id=\"file-gist_for_medium_article-py-L11\" class=\"blob-num js-line-number\" data-line-number=\"11\"><\/td>\n<td id=\"file-gist_for_medium_article-py-LC11\" class=\"blob-code blob-code-inner js-file-line\"><\/td>\n<\/tr>\n<tr>\n<td id=\"file-gist_for_medium_article-py-L12\" class=\"blob-num js-line-number\" data-line-number=\"12\"><\/td>\n<td id=\"file-gist_for_medium_article-py-LC12\" class=\"blob-code blob-code-inner js-file-line\"><span class=\"pl-s1\">bevoorrechte_groepen<\/span> <span class=\"pl-c1\">=<\/span> []<\/td>\n<\/tr>\n<tr>\n<td id=\"file-gist_for_medium_article-py-L13\" class=\"blob-num js-line-number\" data-line-number=\"13\"><\/td>\n<td id=\"file-gist_for_medium_article-py-LC13\" class=\"blob-code blob-code-inner js-file-line\"><span class=\"pl-s1\">ongeprivilegieerde_groepen<\/span> <span class=\"pl-c1\">=<\/span> []<\/td>\n<\/tr>\n<tr>\n<td id=\"file-gist_for_medium_article-py-L14\" class=\"blob-num js-line-number\" data-line-number=\"14\"><\/td>\n<td id=\"file-gist_for_medium_article-py-LC14\" class=\"blob-code blob-code-inner js-file-line\"><\/td>\n<\/tr>\n<tr>\n<td id=\"file-gist_for_medium_article-py-L15\" class=\"blob-num js-line-number\" data-line-number=\"15\"><\/td>\n<td id=\"file-gist_for_medium_article-py-LC15\" class=\"blob-code blob-code-inner js-file-line\"><span class=\"pl-s1\">trein_bldm<\/span> <span class=\"pl-c1\">=<\/span> <span class=\"pl-v\">BinairLabelDatasetMetric<\/span>(<span class=\"pl-s1\">trein_standaard_dataset<\/span>,<\/td>\n<\/tr>\n<tr>\n<td id=\"file-gist_for_medium_article-py-L16\" class=\"blob-num js-line-number\" data-line-number=\"16\"><\/td>\n<td id=\"file-gist_for_medium_article-py-LC16\" class=\"blob-code blob-code-inner js-file-line\"><span class=\"pl-s1\">ongeprivilegieerde_groepen<\/span><span class=\"pl-c1\">=<\/span><span class=\"pl-s1\">ongeprivilegieerde_groepen<\/span>,<\/td>\n<\/tr>\n<tr>\n<td id=\"file-gist_for_medium_article-py-L17\" class=\"blob-num js-line-number\" data-line-number=\"17\"><\/td>\n<td id=\"file-gist_for_medium_article-py-LC17\" class=\"blob-code blob-code-inner js-file-line\"><span class=\"pl-s1\">bevoorrechte_groepen<\/span><span class=\"pl-c1\">=<\/span><span class=\"pl-s1\">bevoorrechte_groepen<\/span>)<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div><div class=\"fusion-text fusion-text-28\"><p>Eenmaal gemeten op de training data van ons scorevoorbeeld, zien we een gemiddeld statistisch pariteitsverschil van -0,21, wat aangeeft dat de bevoorrechte groep\u00a0<em>Mannelijk<\/em>\u00a0had 21% meer positieve resultaten in de trainingsset data.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-12 fusion-sep-none fusion-title-text fusion-title-size-four\" style=\"--awb-margin-bottom-small:8px;\"><h4 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Beperking van vertekeningen<\/h4><\/div><div class=\"fusion-text fusion-text-29\"><p>Methoden die gericht zijn op algoritmische vertekeningen worden gewoonlijk in drie categorie\u00ebn onderverdeeld:<\/p>\n<\/div><ul style=\"--awb-line-height:27.2px;--awb-icon-width:27.2px;--awb-icon-height:27.2px;--awb-icon-margin:11.2px;--awb-content-margin:38.4px;\" class=\"fusion-checklist fusion-checklist-1 fusion-checklist-default type-icons\"><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>Voorverwerking.<\/strong> Voorverwerkingstechnieken werken op de training data en proberen deze te transformeren zodat de onderliggende discriminatie verwijderd wordt.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>In verwerking.<\/strong> In-processing technieken werken in op de leeralgoritmen om discriminatie tijdens het modeltrainingsproces te verwijderen, hetzij door veranderingen in de doelfunctie op te nemen, hetzij door een beperking op te leggen.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\"><strong>Post-processing<\/strong>. Nabewerkingstechnieken die een reeds getraind model nemen en de voorspellingen ervan zodanig transformeren dat ze voldoen aan de beperkingen die de geselecteerde eerlijkheidsmetriek met zich meebrengt. Dit is vooral nuttig in het geval dat het algoritme het geleerde model alleen als een black box kan behandelen, zonder enige mogelijkheid om de training data of het leeralgoritme aan te passen.<\/div><\/li><\/ul><div class=\"fusion-text fusion-text-30\"><p>We gebruikten een voorbewerkingstechniek op de training data om het statistische pariteitsverschil te optimaliseren. We pasten de\u00a0<em>Herweging<\/em>\u00a0algoritme (meer details in deze\u00a0<a class=\"ds iu\" href=\"https:\/\/core.ac.uk\/download\/pdf\/81728147.pdf\" rel=\"noopener nofollow\" target=\"_blank\">artikel<\/a><a class=\"ds iu\" href=\"https:\/\/core.ac.uk\/download\/pdf\/81728147.pdf)\" rel=\"noopener nofollow\" target=\"_blank\">)<\/a>\u00a0die in AIF360 is ge\u00efmplementeerd om de voorbeelden in elke combinatie (groep, label) anders te wegen om eerlijkheid voor classificatie te garanderen.<\/p>\n<\/div><div class=\"fusion-text fusion-text-31\"><div class=\"code\">\n<table class=\"highlight tab-size js-file-line-container\" data-tab-size=\"8\" data-paste-markdown-skip=\"\">\n<tbody>\n<tr>\n<td id=\"file-gist_for_medium_article-py-LC1\" class=\"blob-code blob-code-inner js-file-line\"><\/td>\n<\/tr>\n<tr>\n<td id=\"file-gist_for_medium_article-py-L2\" class=\"blob-num js-line-number\" data-line-number=\"2\">\n<pre>RW = Opnieuw wegen(unprivileged_groups=unprivileged_groups,\n                privileged_groups=privileged_groups)\n\nherwogen_train = RW.fit_transform(train_standard_dataset)<\/pre>\n<\/td>\n<td id=\"file-gist_for_medium_article-py-LC2\" class=\"blob-code blob-code-inner js-file-line\"><\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div><div class=\"fusion-text fusion-text-32\"><p>Het kenmerk instance weights is gewijzigd om het gevoelige kenmerk opnieuw in evenwicht te brengen met betrekking tot het doel. Hierdoor wordt de\u00a0<em>Herweging<\/em>\u00a0algoritme verminderde de groepsvooringenomenheid op de training data: een nieuwe maat voor het statistische pariteitsverschil is volledig herschikt van -0,21 naar 0.<\/p>\n<p>Er zijn nog andere algoritmen voor biasvermindering v\u00f3\u00f3r de verwerking ge\u00efmplementeerd in AIF360, zoals de\u00a0<em>DisparateImpactRemover<\/em>\u00a0wat een techniek is die de waarden van kenmerken bewerkt om de eerlijkheid van groepen te vergroten terwijl de rangorde binnen groepen behouden blijft (meer informatie in de volgende\u00a0<a class=\"ds iu\" href=\"https:\/\/arxiv.org\/abs\/1412.3756\" rel=\"noopener nofollow\" target=\"_blank\">artikel<\/a>) of\u00a0<em>LFR<\/em>\u00a0(Leren van eerlijke representatie), wat een voorbewerkingstechniek is die een latente representatie vindt die de data codeert maar informatie over de beschermde attributen verbergt (meer info in het volgende\u00a0<a class=\"ds iu\" href=\"http:\/\/www.cs.toronto.edu\/~toni\/Papers\/icml-final.pdf\" rel=\"noopener nofollow\" target=\"_blank\">artikel<\/a>).<\/p>\n<p>Vervolgens hebben we twee classificatiemodellen getraind, \u00e9\u00e9n op de oorspronkelijke data en de andere op de herwogen data. We stellen vast dat herweging slechts een zwakke invloed had op de prestaties, met een verlies van 1% van\u00a0<a class=\"ds iu\" href=\"https:\/\/en.wikipedia.org\/wiki\/F-score\" rel=\"noopener nofollow\" target=\"_blank\">F1-score<\/a>.<\/p>\n<\/div><div class=\"fusion-text fusion-text-33\"><p>We hebben ook een algoritme voor in-processing uitgeprobeerd op ons voorbeeldgebruik:\u00a0<a class=\"ds iu\" href=\"https:\/\/arxiv.org\/abs\/1801.07593\" rel=\"noopener nofollow\" target=\"_blank\"><em>contradictoire debiatie<\/em><\/a>\u00a0die de groepsvertekeningsmetriek aanzienlijk verbeterde (het statistische pariteitsverschil werd gedeeld door 2) met weinig verslechtering van de modelprestaties (ongeveer 1% op de F1-score).<\/p>\n<p>Er kan dus een compromis zijn tussen prestatie- en biasmetriek. Hier is de verslechtering vrij klein, maar in sommige situaties kan het compromis acuter zijn. Deze informatie moet aan het licht gebracht worden bij het team en de juiste belanghebbenden, die beslissingen kunnen nemen over hoe met dit probleem om te gaan.<\/p>\n<p>Nu we getrainde modellen hebben, kunnen we hun voorspellingen onderzoeken en nagaan of er geen onevenwicht is in de gunstige uitkomst voor de verschillende geslachten. Er zijn veel hulpmiddelen zoals\u00a0<a class=\"ds iu\" href=\"https:\/\/github.com\/PAIR-code\/what-if-tool\" rel=\"noopener nofollow\" target=\"_blank\">Wat-als hulpmiddel<\/a>\u00a0of\u00a0<a class=\"ds iu\" href=\"https:\/\/github.com\/dssg\/aequitas\" rel=\"noopener nofollow\" target=\"_blank\">Aequitas<\/a>\u00a0waarmee u het gedrag van getrainde modellen voor machinaal leren kunt onderzoeken en de modelprestaties en eerlijkheid tussen subgroepen kunt onderzoeken.<\/p>\n<p>Ter illustratie kunt u Aequitas gebruiken om kruistabellen en visualisaties te genereren die verschillende bias- en prestatiecijfers weergeven, verdeeld over de subgroepen. We kunnen bijvoorbeeld snel de true positive percentages vergelijken van de classifiers die getraind zijn op de originele data en op de herwogen data. We zien dat dit percentage gebalanceerd is en daarom meer gendergelijkheid mogelijk maakt voor de gunstige uitkomst van het model om in aanmerking te komen voor een premium deal.<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-6 hover-type-none\"><img decoding=\"async\" width=\"1000\" height=\"381\" title=\"blog-2-Karim\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-2-Karim.png\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-2-Karim.png\" alt class=\"lazyload img-responsive wp-image-61834\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%271000%27%20height%3D%27381%27%20viewBox%3D%270%200%201000%20381%27%3E%3Crect%20width%3D%271000%27%20height%3D%27381%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-2-Karim-200x76.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-2-Karim-400x152.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-2-Karim-600x229.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-2-Karim-800x305.png 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-2-Karim.png 1000w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 1000px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-34\"><p>Als nabewerkingstechniek hebben we de classificatiedrempel gebruikt. Een classificatiemodel geeft ons gewoonlijk de waarschijnlijkheid die gepaard gaat met de realisatie van elke klasse als voorspelling. Deze waarschijnlijkheid kan als zodanig worden gebruikt of worden omgezet in een binaire waarde.<br \/>\nOm de klasse te identificeren die overeenkomt met de verkregen waarschijnlijkheden, moet er een classificatiedrempel (ook beslissingsdrempel genoemd) worden gedefinieerd. Elke waarde boven deze drempel komt overeen met de positieve categorie \u201ckomt in aanmerking voor een premietransactie\u201d en omgekeerd voor waarden onder deze drempel.<br \/>\nDoor de prestatiemeting en de vertekeningsmeting (hier 1 - ongelijke impact) over alle classificatiedrempels uit te zetten, kunnen we de optimale drempel bepalen. Dit helpt ons bij het kiezen van de juiste drempel om de prestatie te maximaliseren en de vertekening te minimaliseren.<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-7 hover-type-none\"><img decoding=\"async\" width=\"1000\" height=\"364\" title=\"blog-4-Karim\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-4-Karim.png\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-4-Karim.png\" alt class=\"lazyload img-responsive wp-image-61835\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%271000%27%20height%3D%27364%27%20viewBox%3D%270%200%201000%20364%27%3E%3Crect%20width%3D%271000%27%20height%3D%27364%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-4-Karim-200x73.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-4-Karim-400x146.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-4-Karim-600x218.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-4-Karim-800x291.png 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-4-Karim.png 1000w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 1000px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-35\"><p>Op de linkerfiguur zien we dat als we de drempelwaarde naar links verschuiven, waardoor de prestatie iets lager wordt, we de biasmeting kunnen verbeteren.<br \/>\nZoals verwacht, zien we ook een duidelijke verbetering van de groepsvooringenomenheid bij het herwogen model (rechter figuur), die nog verder kan worden verbeterd door een andere classificatiedrempel te kiezen, maar dit gaat ten koste van de prestaties.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-13 fusion-sep-none fusion-title-text fusion-title-size-three\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Verklaarbaarheid<\/h3><\/div><div class=\"fusion-text fusion-text-36\"><p>Een andere belangrijke pijler voor het bouwen van betrouwbare modellen voor machinaal leren is de verklaarbaarheid. Uitlegbaarheid is het vermogen om zowel de technische processen van het AI-systeem als de redenering achter de beslissingen of voorspellingen die het AI-systeem maakt, uit te leggen en dus de invloed van elke eigenschap\/attribuut op de voorspellingen te kunnen kwantificeren. Het is een goede gewoonte om zoveel mogelijk gebruik te maken van gemakkelijk interpreteerbare modellen in plaats van black-box-modellen.<\/p>\n<p>Er zijn veel methoden om de verklaarbaarheid van modellen te verkrijgen. Deze methoden kunnen gegroepeerd worden in 2 categorie\u00ebn:<\/p>\n<\/div><ul style=\"--awb-line-height:27.2px;--awb-icon-width:27.2px;--awb-icon-height:27.2px;--awb-icon-margin:11.2px;--awb-content-margin:38.4px;\" class=\"fusion-checklist fusion-checklist-2 fusion-checklist-default type-icons\"><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\"><strong>Intrinsieke verklaarbaarheid\u00a0<\/strong>waarbij het model zelf het belang of de gewichten van de kenmerken geeft.<\/p>\n<p><strong>Post-hoc verklaarbaarheid<\/strong>\u00a0waarbij kleine invoerveranderingen worden gebruikt om het belang van kenmerken af te leiden.<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>In verwerking.<\/strong> In-processing technieken werken in op de leeralgoritmen om discriminatie tijdens het modeltrainingsproces te verwijderen, hetzij door veranderingen in de doelfunctie op te nemen, hetzij door een beperking op te leggen.<\/p>\n<\/div><\/li><\/ul><div class=\"fusion-text fusion-text-37\"><p>Hier passen we een beroemde post-hocmethode toe, namelijk SHAP (SHapley Additive exPlanations), voor meer informatie raden we aan om te kijken op\u00a0<a class=\"ds iu\" href=\"https:\/\/christophm.github.io\/interpretable-ml-book\/shap.html\" rel=\"noopener nofollow\" target=\"_blank\">deze zeer uitgebreide bron over het onderwerp<\/a>.\u00a0<a class=\"ds iu\" href=\"https:\/\/github.com\/slundberg\/shap\" rel=\"noopener nofollow\" target=\"_blank\">Shap<\/a>\u00a0is een bibliotheek die een speltheoretische benadering implementeert om de uitvoer van eender welk machine-learningmodel te verklaren.<br \/>\nLaten we eens kijken naar de invloed van het Reweighing-algoritme op de verklaarbaarheid van het model:<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-8 hover-type-none\"><img decoding=\"async\" width=\"700\" height=\"508\" title=\"blog-5-Karim\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-5-Karim.jpeg\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-5-Karim.jpeg\" alt class=\"lazyload img-responsive wp-image-61836\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27700%27%20height%3D%27508%27%20viewBox%3D%270%200%20700%20508%27%3E%3Crect%20width%3D%27700%27%20height%3D%27508%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-5-Karim-200x145.jpeg 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-5-Karim-400x290.jpeg 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-5-Karim-600x435.jpeg 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-5-Karim.jpeg 700w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 700px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-38\"><p>Korte herinnering over hoe u Shap's moet lezen\u00a0<em>bijenwarm<\/em>\u00a0percelen:<\/p>\n<\/div><ul style=\"--awb-line-height:27.2px;--awb-icon-width:27.2px;--awb-icon-height:27.2px;--awb-icon-margin:11.2px;--awb-content-margin:38.4px;\" class=\"fusion-checklist fusion-checklist-3 fusion-checklist-default type-icons\"><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>De kenmerken worden van boven naar beneden gesorteerd, van het belangrijkste naar het minst belangrijke.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>De kleur komt overeen met de amplitude van de waarden van het kenmerk. Hoe roder de kleur, hoe lager de waarde en omgekeerd voor blauw.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>De horizontale as komt overeen met de richting van de invloed van het kenmerk op de voorspelling van het doel. In ons voorbeeld van een puntenscore zullen negatieve waarden bijvoorbeeld de voorspelling be\u00efnvloeden in de richting van de klasse \u201ckomt niet in aanmerking voor een premiedeal\u201d en omgekeerd voor positieve waarden.<\/p>\n<\/div><\/li><\/ul><div class=\"fusion-text fusion-text-39\"><p>Aan de linkerkant staat de verklaarbaarheid van het oorspronkelijke model, waarbij we zien dat in dit geval de geslachtsvariabele een zeer sterke voorspellende kracht heeft en dat het geslacht\u00a0<em>Vrouw<\/em>\u00a0een invloed heeft op de beslissing om \u201cniet in aanmerking te komen voor een premiedeal\u201d, met een grote kloof met betrekking tot het geslacht\u00a0<em>Mannelijk<\/em>.<\/p>\n<p>We kunnen in de rechter grafiek zien, in dit geval waar het model werd getraind op de herwogen data, dat het belang van het geslachtkenmerk sterk is afgenomen. Het behoort nu tot de minst belangrijke kenmerken. Bovendien is de invloed van de vrouwelijke vs. mannelijke klasse op de voorspelling van het doel veel evenwichtiger (de kleuren liggen dicht bij 0 in Shapley-waarde).<\/p>\n<\/div><div class=\"fusion-title title fusion-title-14 fusion-sep-none fusion-title-text fusion-title-size-three\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Traceerbaarheid<\/h3><\/div><div class=\"fusion-text fusion-text-40\"><p>Een ander essentieel aspect in het proces van het cre\u00ebren van betrouwbare machine-learningalgoritmen is de traceerbaarheid van resultaten en goede reproduceerbaarheid van experimenten. Dit maakt het gemakkelijk om te identificeren welke versie van een model in productie is genomen, zodat het gecontroleerd kan worden als het gedrag schade veroorzaakt en niet langer in overeenstemming is met de ethische waarden van het bedrijf.<\/p>\n<p>Om dit te kunnen doen, moet men elke modelversie en de bijbehorende trainings data, hyperparameters en resultaten kunnen bijhouden en vastleggen. Verschillende hulpmiddelen kunnen deze taak uitvoeren:\u00a0<a class=\"ds iu\" href=\"https:\/\/mlflow.org\/docs\/latest\/index.html\" rel=\"noopener nofollow\" target=\"_blank\">Mlflow<\/a>\u00a0is een geweldige optie waarmee u snel een webinterface kunt genereren die alle runs centraliseert, terwijl u uw artefacten opslaat in de opslag van uw keuze. Elke versie van het experiment kan gevolgd worden met de hash van de bijbehorende commit. Elk van deze versies bevat alle elementen die door MLflow zijn vastgelegd.<\/p>\n<p>Hier is een\u00a0<a class=\"ds iu\" href=\"https:\/\/github.com\/artefactory\/one-click-mlflow\" rel=\"noopener nofollow\" target=\"_blank\">gereedschap<\/a>\u00a0die we op Artefact open source hebben gemaakt, waarmee u met \u00e9\u00e9n commando een beveiligde MLflow op een GCP-project kunt implementeren.<\/p>\n<p>Het is ook een goed gebruik om een\u00a0<a class=\"ds iu\" href=\"https:\/\/aifs360.mybluemix.net\/introduction\" rel=\"noopener nofollow\" target=\"_blank\">Factsheet<\/a>\u00a0voor elk model, wat overeenkomt met een modelidentiteitskaart die verschillende elementen samenvat, zoals de voorbewerkingsstappen, prestatiemetingen, biasmetingen, enz.<\/p>\n<p>Deze FactSheets worden door de data wetenschappers aan de modeluitvoeringsteams geleverd, zodat zij kunnen bepalen of het model geschikt is voor hun situatie. Voor meer details over de methodologie voor het maken van een FactSheet raden wij u het volgende aan\u00a0<a class=\"ds iu\" href=\"https:\/\/arxiv.org\/pdf\/2006.13796.pdf\" rel=\"noopener nofollow\" target=\"_blank\">artikel<\/a>. De FactSheet kan ook worden opgeslagen, bijvoorbeeld in tabelvorm, in MLFlow naast het bijbehorende model.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-15 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Hoe volgt u ethiek op nadat u bent ingezet?<\/h2><\/div><div class=\"fusion-text fusion-text-41\"><p>Zodra uw model wordt ingezet, moet u ervoor zorgen dat het wordt gebruikt voor het doel waarvoor het is bedacht, ontworpen en gebouwd. Deployment bias treedt op wanneer er een mismatch is tussen het probleem dat een model moet oplossen en de manier waarop het daadwerkelijk wordt gebruikt. Dit gebeurt vaak als een systeem ontwikkeld en ge\u00ebvalueerd wordt alsof het volledig op zichzelf staat, terwijl het in werkelijkheid deel uitmaakt van een complex socio-technisch systeem dat bestuurd wordt door een groot aantal besluitvormers.<\/p>\n<p>Productie data kan in de loop van de tijd gaan driften, wat kan resulteren in een verslechtering van de algoritmeprestaties waardoor vertekeningen kunnen ontstaan. Het bijhouden van de kwaliteit van de geproduceerde data en de data drift door de distributies van nieuwe data in vergelijking met de data die gebruikt zijn om de modellen te trainen te controleren, moet een stap zijn in de productiepijplijn om indien nodig de juiste waarschuwingen te geven en te bepalen wanneer herscholing verplicht is.<\/p>\n<p>De productiepijplijn moet zo ontworpen zijn dat er een manier is om het huidige model uit te schakelen of terug te gaan naar een vorige versie.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-16 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Conclusie<\/h2><\/div><div class=\"fusion-text fusion-text-42\"><p>In dit artikel hebben we enkele goede praktijken en protocollen gepresenteerd om u te begeleiden bij het bouwen van machine learning-pijplijnen die het risico om in ethische valkuilen te trappen minimaliseren.<\/p>\n<\/div><div class=\"fusion-text fusion-text-43\"><p>Dit artikel heeft nauwelijks het oppervlak van het enorme onderwerp dat ethische AI is, aangeraakt en slechts een paar van de belangrijkste onderwerpen aangestipt.\u00a0<a class=\"ds iu\" href=\"https:\/\/github.com\/EthicalML\/awesome-production-machine-learning#explaining-black-box-models-and-datasets\" rel=\"noopener nofollow\" target=\"_blank\">interessante tools<\/a>\u00a0ontwikkeld die nu beschikbaar zijn.<br \/>\nZoals we gezien hebben, is de meest logische manier om problemen met eerlijkheid expliciet aan te pakken, om een verzameling geselecteerde kenmerken als potentieel discriminerend te bestempelen en vervolgens door dit prisma ethisch vooroordeel te onderzoeken. Deze eenvoudige techniek heeft echter een fout, omdat discriminatie het resultaat kan zijn van een combinatie van kenmerken die op zichzelf niet discriminerend zijn. Bovendien zult u in veel gevallen geen toegang hebben tot gevoelige kenmerken (meer over dit onderwerp\u00a0<a class=\"ds iu\" href=\"https:\/\/arxiv.org\/pdf\/2011.02282.pdf\" rel=\"noopener nofollow\" target=\"_blank\">hier<\/a>).<br \/>\nHet beoordelen van eerlijkheid is een complexe taak die afhankelijk is van de aard van het probleem. Het benaderen van een scoringsprobleem op basis van data in tabelvorm zal niet hetzelfde zijn als\u00a0<a class=\"ds iu\" href=\"https:\/\/arxiv.org\/abs\/1906.08976\" rel=\"noopener nofollow\" target=\"_blank\">vooroordelen in natuurlijke taalverwerking beperken<\/a>.<\/p>\n<\/div><div class=\"fusion-text fusion-text-44\"><p>We hopen dat het delen van onze visie en methodologie\u00ebn u zal inspireren in uw eigen projecten! Bedankt voor het lezen, aarzel niet om de Artefact tech te volgen\u00a0<a class=\"ds iu\" href=\"https:\/\/medium.com\/artefact-engineering-and-data-science\" rel=\"noopener\" target=\"_blank\">blog<\/a>\u00a0als u op de hoogte wilt worden gebracht wanneer ons volgende artikel verschijnt!<\/p>\n<\/div><\/div><\/div><\/div><\/article><\/p>","protected":false},"excerpt":{"rendered":"<p>27 juli 2021<br \/>\nHier volgen enkele richtlijnen om betrouwbare oplossingen voor machinaal leren te bouwen zonder in ethische valkuilen te trappen.<\/p>","protected":false},"featured_media":68681,"parent":0,"template":"","meta":{"_acf_changed":false,"ep_exclude_from_search":false},"blog-category":[21939],"blog-language":[2991],"class_list":["post-61815","blog","type-blog","status-publish","has-post-thumbnail","hentry","blog-category-medium","blog-language-en"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.artefact.com\/nl\/wp-json\/wp\/v2\/blog\/61815","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.artefact.com\/nl\/wp-json\/wp\/v2\/blog"}],"about":[{"href":"https:\/\/www.artefact.com\/nl\/wp-json\/wp\/v2\/types\/blog"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.artefact.com\/nl\/wp-json\/wp\/v2\/media\/68681"}],"wp:attachment":[{"href":"https:\/\/www.artefact.com\/nl\/wp-json\/wp\/v2\/media?parent=61815"}],"wp:term":[{"taxonomy":"blog-category","embeddable":true,"href":"https:\/\/www.artefact.com\/nl\/wp-json\/wp\/v2\/blog-category?post=61815"},{"taxonomy":"blog-language","embeddable":true,"href":"https:\/\/www.artefact.com\/nl\/wp-json\/wp\/v2\/blog-language?post=61815"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}