	{"id":61815,"date":"2021-07-27T16:15:44","date_gmt":"2021-07-27T15:15:44","guid":{"rendered":"https:\/\/www.artefact.com\/?post_type=news&#038;p=61815"},"modified":"2024-09-20T17:45:46","modified_gmt":"2024-09-20T16:45:46","slug":"including-ethics-best-practices-in-your-data-science-project-from-day-one","status":"publish","type":"blog","link":"https:\/\/www.artefact.com\/de\/blog\/including-ethics-best-practices-in-your-data-science-project-from-day-one\/","title":{"rendered":"Integrieren Sie vom ersten Tag an bew\u00e4hrte ethische Praktiken in Ihr wissenschaftliches Projekt Data"},"content":{"rendered":"<p><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling article-author\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-background-color:#ffffff;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_2 1_2 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:50%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:50%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-1 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Autor<\/h2><\/div><img decoding=\"async\" src=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27150%27%20height%3D%270%27%20viewBox%3D%270%200%20150%200%27%3E%3Crect%20width%3D%27150%27%20height%3D%270%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/02\/Karim-e1614443653963.png\" alt=\"Image\" class=\"lazyload artefact-elegant-image align-left article-author-image\" style=\"width: 150px; border-radius: 54% 46% 77% 23% \/ 74% 40% 60% 26%; overflow: hidden;\" width=\"150\" height=\"auto\" \/><div class=\"fusion-title title fusion-title-2 fusion-sep-none fusion-title-text fusion-title-size-three article-author-name-title\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Karim Si Larbi<\/h3><\/div><div class=\"fusion-text fusion-text-1 article-author-description\"><p>Leitender Data-Wissenschaftler bei Artefact<\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-2 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-1 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-text fusion-text-2 description\"><p>Hier sind einige Richtlinien, um vertrauensw\u00fcrdige L\u00f6sungen f\u00fcr maschinelles Lernen zu entwickeln, ohne in ethische Fallen zu tappen.<\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-3 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-margin-top:40px;--awb-margin-bottom:40px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-center fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-2 fusion_builder_column_1_1 1_1 fusion-flex-column fusion-flex-align-self-center fusion-column-inner-bg-wrapper\" style=\"--awb-padding-top:20px;--awb-padding-right:20px;--awb-padding-bottom:20px;--awb-padding-left:20px;--awb-overflow:hidden;--awb-inner-bg-size:cover;--awb-border-color:rgba(10,17,40,0.1);--awb-border-top:1px;--awb-border-right:1px;--awb-border-bottom:1px;--awb-border-left:1px;--awb-border-style:solid;--awb-border-radius:4px 4px 4px 4px;--awb-inner-bg-border-radius:4px 4px 4px 4px;--awb-inner-bg-overflow:hidden;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><span class=\"fusion-column-inner-bg hover-type-none\"><a class=\"fusion-column-anchor\" href=\"https:\/\/medi&#117;&#109;&#46;&#99;&#111;&#109;&#47;&#x40;&#x6b;&#x61;&#x72;&#x69;&#x6d;&#x2e;&#x73;&#x69;&#x6c;&#x61;&#x72;bi?p=c15b26c2bf99\" rel=\"noopener noreferrer\" target=\"_blank\"><span class=\"fusion-column-inner-bg-image\"><\/span><\/a><\/span><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-center fusion-content-layout-row fusion-flex-align-items-center\"><div class=\"fusion-text fusion-text-3\"><p><u>Lesen Sie unseren Artikel \u00fcber<\/u><\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-margin-right:20px;--awb-margin-left:20px;--awb-max-width:150px;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-1 hover-type-none\"><img decoding=\"async\" width=\"72\" height=\"41\" title=\"mittel\" src=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%2772%27%20height%3D%2741%27%20viewBox%3D%270%200%2072%2041%27%3E%3Crect%20width%3D%2772%27%20height%3D%2741%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/medium.png\" alt class=\"lazyload img-responsive wp-image-60927\"\/><\/span><\/div><div class=\"fusion-text fusion-text-4\"><p>.<\/p>\n<\/div><\/div><\/div><\/div><\/div><article class=\"fusion-fullwidth fullwidth-box fusion-builder-row-4 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-3 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-3 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Einf\u00fchrung<\/h2><\/div><div class=\"fusion-text fusion-text-5\"><p>Der Einsatz von maschinellem Lernen als Mittel zur Entscheidungsfindung ist mittlerweile allgegenw\u00e4rtig. Viele der Ergebnisse von Diensten, die wir t\u00e4glich nutzen, sind das Ergebnis einer Entscheidung, die durch maschinelles Lernen getroffen wurde. Infolgedessen werden menschliche Eingriffe in Bereichen, die jeden Aspekt unseres t\u00e4glichen Lebens betreffen und in denen jeder Fehler im Urteil des algorithmischen Modells negative Auswirkungen haben k\u00f6nnte, allm\u00e4hlich reduziert. Es ist daher unerl\u00e4sslich, angemessene Richtlinien festzulegen, um vertrauensw\u00fcrdige und verantwortungsvolle L\u00f6sungen f\u00fcr das maschinelle Lernen zu entwickeln und dabei die Ethik als Grundpfeiler zu ber\u00fccksichtigen.<\/p>\n<\/div><div class=\"fusion-text fusion-text-6\"><p>In den letzten Jahren hat die Ethik im Bereich des maschinellen Lernens einen bedeutenden Anstieg der akademischen Forschung erlebt, mit gro\u00dfen Konferenzen wie\u00a0<a class=\"ds iu\" href=\"https:\/\/facctconference.org\/index.html\" rel=\"noopener nofollow\" target=\"_blank\">FACCT<\/a>\u00a0und\u00a0<a class=\"ds iu\" href=\"https:\/\/www.aies-conference.com\/2021\/\" rel=\"noopener nofollow\" target=\"_blank\">AIES<\/a>, sowie in gro\u00dfen Technologieunternehmen, die schnell wachsende Teams zusammenstellen, um die ethischen Herausforderungen zu meistern.<\/p>\n<\/div><div class=\"fusion-text fusion-text-7\"><p>Ethische KI ist ein weites Feld, das viele Themen wie Datenschutz, data governance, gesellschaftliches und \u00f6kologisches Wohlergehen, algorithmische Verantwortlichkeit usw. umfasst. In diesem Artikel werden wir uns haupts\u00e4chlich auf die folgenden Komponenten der Ethik beim maschinellen Lernen konzentrieren:\u00a0<strong>Fairness, Erkl\u00e4rbarkeit und Nachvollziehbarkeit<\/strong>. Wir werden zun\u00e4chst er\u00f6rtern, was auf dem Spiel steht und warum es unerl\u00e4sslich ist, auf Ethik zu achten. Dann werden wir untersuchen, wie Sie Ihr maschinelles Lernprojekt unter Ber\u00fccksichtigung der Ethik konzipieren und entwickeln und wie Sie die Ethik nach dem Einsatz in der Produktion weiterverfolgen k\u00f6nnen.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-4 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Warum wir der Ethik Aufmerksamkeit schenken sollten<\/h2><\/div><div class=\"fusion-text fusion-text-8\"><p>Da die Algorithmen des maschinellen Lernens und die ihnen zugrunde liegenden Abstraktionen und Hypothesen immer komplexer werden, ist es schwierig geworden, alle m\u00f6glichen Konsequenzen des gesamten Systems vollst\u00e4ndig zu erfassen und zu verstehen.<br \/>\nEs gibt mehrere bekannte Beispiele aus der Praxis, in denen unfaire Algorithmen f\u00fcr maschinelles Lernen zu suboptimalen und diskriminierenden Ergebnissen f\u00fchren. Darunter das bekannte Beispiel von COMPAS. COMPAS war eine weit verbreitete kommerzielle Software, die das Risiko einer Person misst, ein weiteres Verbrechen zu begehen, und die mit dem normalen menschlichen Urteilsverm\u00f6gen in einem\u00a0<a class=\"ds iu\" href=\"https:\/\/www.propublica.org\/article\/machine-bias-risk-assessments-in-criminal-sentencing\" rel=\"noopener nofollow\" target=\"_blank\">Studie<\/a>\u00a0und wurde sp\u00e4ter als voreingenommen gegen\u00fcber Afro-Amerikanern entdeckt: COMPAS wies afro-amerikanischen Straft\u00e4tern mit gr\u00f6\u00dferer Wahrscheinlichkeit einen h\u00f6heren Risikowert zu als wei\u00dfen Straft\u00e4tern mit demselben Profil.<\/p>\n<\/div><div class=\"fusion-text fusion-text-9\"><p>Im Bereich NLP wurde in fr\u00fchen Versionen von Google Translate ein Gender Biais entdeckt, das 2018 und in j\u00fcngerer Zeit behoben wurde.<\/p>\n<p>Im Bereich der Kreditvergabe wurde gegen Goldman Sachs ermittelt, weil sie einen KI-Algorithmus einsetzten, der angeblich women diskriminierte, indem er M\u00e4nnern gr\u00f6\u00dfere Kreditlimits auf ihren Apple-Karten gew\u00e4hrte als women.<\/p>\n<p>Im Bereich des Gesundheitswesens hat ein Algorithmus zur Risikovorhersage, der bei mehr als 200 Millionen Menschen in den USA eingesetzt wurde, rassistische Verzerrungen gezeigt.<\/p>\n<\/div><div class=\"fusion-text fusion-text-10\"><p>Ohne einen klar definierten Rahmen f\u00fcr die Analyse, Identifizierung und Milderung von Verzerrungen ist das Risiko, in ethische Fallen zu tappen, ziemlich hoch. Es wird daher immer wichtiger, angemessene Richtlinien festzulegen, um Modelle zu entwickeln, die angemessene und faire Ergebnisse liefern, insbesondere in Bereichen, in denen Menschen involviert sind. Die Entwicklung vertrauensw\u00fcrdiger KI gibt den Endnutzern ein sicheres Gef\u00fchl, wenn sie sie verwenden, und erm\u00f6glicht es Unternehmen, mehr Kontrolle \u00fcber ihre Verwendung auszu\u00fcben, um die Effizienz zu steigern und gleichzeitig Schaden zu vermeiden.\u00a0<strong>Damit Ihre KI vertrauensw\u00fcrdig ist, m\u00fcssen Sie eigentlich schon vor der Verarbeitung von data und der Entwicklung von Algorithmen anfangen, an Ethik zu denken.<\/strong><\/p>\n<\/div><div class=\"fusion-title title fusion-title-5 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Wie Sie schon vor Beginn Ihres Projekts an Ethik denken<\/h2><\/div><div class=\"fusion-text fusion-text-11\"><p><strong>Die Ethik muss von Beginn eines neuen Projekts an ber\u00fccksichtigt werden, insbesondere in der Phase der Problemstellung. Sie sollten sowohl die anvisierten Endnutzer als auch das Ziel der vorgeschlagenen L\u00f6sung im Auge haben, um den richtigen Rahmen f\u00fcr die Analyse und das Risikomanagement zu schaffen, um die direkten oder indirekten Sch\u00e4den zu identifizieren, die durch die L\u00f6sung verursacht werden k\u00f6nnten.<\/strong>\u00a0Sie sollten sich fragen, ob meine L\u00f6sung unter diesen Bedingungen zu Entscheidungen f\u00fchren k\u00f6nnte, die eine bestimmte Untergruppe von Endnutzern beg\u00fcnstigen?<\/p>\n<\/div><div class=\"fusion-text fusion-text-12\"><p>Es ist daher von entscheidender Bedeutung, KPIs zu entwickeln, um die Methoden zu verfolgen, die die Wirksamkeit Ihrer Risikomanagementstrategie gew\u00e4hrleisten. Ein solides Rahmenwerk k\u00f6nnte auch, wenn m\u00f6glich, ethische Risikominderungsmechanismen einbeziehen.<br \/>\nWenn es sich um ein sensibles Thema handelt, das ein hohes Risikopotenzial birgt, ist es notwendig, die f\u00fcr die Explorations- und Aufbauphase vorgesehene Zeit zu verl\u00e4ngern, um eine gr\u00fcndliche Analyse der ethischen Bewertung und\u00a0<strong>Abschw\u00e4chung von Vorurteilen<\/strong>\u00a0Strategien.<\/p>\n<\/div><div class=\"fusion-text fusion-text-13\"><p>Sie m\u00fcssen auch Mechanismen einrichten, die dem KI-System die\u00a0<strong>Pr\u00fcfbarkeit<\/strong>\u00a0und\u00a0<strong> Reproduzierbarkeit <\/strong>. Eine Logikspur muss zur Inspektion verf\u00fcgbar sein, damit alle Probleme \u00fcberpr\u00fcft oder weiter untersucht werden k\u00f6nnen. Dies geschieht durch die Durchsetzung eines guten Niveaus an\u00a0<strong>R\u00fcckverfolgbarkeit<\/strong>\u00a0durch Dokumentation, Protokollierung, Nachverfolgung und Versionierung.<\/p>\n<p>Jede data-Quelle und jede data-Umwandlung muss ebenfalls dokumentiert werden, um die bei der Verarbeitung des data getroffenen Entscheidungen transparent und nachvollziehbar zu machen. Auf diese Weise lassen sich die Schritte ermitteln, die m\u00f6glicherweise eine Verzerrung verursacht oder verst\u00e4rkt haben.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-6 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Wie Sie bei der Entwicklung Ihres data-Projekts ethische Aspekte ber\u00fccksichtigen k\u00f6nnen<\/h2><\/div><div class=\"fusion-text fusion-text-14\"><p>Um Ethik in die Entwicklung Ihres data-Projekts einzubeziehen, ist es wichtig, mindestens drei Komponenten zu ber\u00fccksichtigen: Fairness, Erkl\u00e4rbarkeit und Nachvollziehbarkeit.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-7 fusion-sep-none fusion-title-text fusion-title-size-three\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Fairness<\/h3><\/div><div class=\"fusion-text fusion-text-15\"><p>Der erste Schritt bei den meisten Projekten zum maschinellen Lernen ist in der Regel die data-Sammlung. Unabh\u00e4ngig davon, ob Sie den Prozess der data-Sammlung durchlaufen oder ein bestehendes data-Set verwenden, ist das Wissen dar\u00fcber, wie die Sammlung durchgef\u00fchrt wurde, entscheidend. In der Regel ist es nicht m\u00f6glich, die gesamte Zielpopulation zu erfassen, so dass Merkmale und Bezeichnungen aus einer Teilmenge entnommen, nach bestimmten Kriterien gefiltert oder aggregiert werden k\u00f6nnen. All diese Schritte k\u00f6nnen zu statistischen Verzerrungen f\u00fchren, die ethische Konsequenzen haben k\u00f6nnen.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-8 fusion-sep-none fusion-title-text fusion-title-size-three\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Voreingenommenheit bei der Repr\u00e4sentation<\/h3><\/div><div class=\"fusion-text fusion-text-16\"><p>ergibt sich aus der Art und Weise, wie wir eine Population definieren und beproben. Zum Beispiel hat der Mangel an geografischer Vielfalt in data-Sets wie ImageNet eine Voreingenommenheit gegen\u00fcber westlichen L\u00e4ndern gezeigt. Als Ergebnis von\u00a0<strong>Stichprobenverzerrung<\/strong>, Die f\u00fcr eine Population gesch\u00e4tzten Trends lassen sich m\u00f6glicherweise nicht auf data aus einer neuen Population \u00fcbertragen.<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-2 hover-type-none\"><img decoding=\"async\" width=\"700\" height=\"594\" title=\"Artikel-einschlie\u00dflich-Ethik\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/Article-Including-ethics.jpeg\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/Article-Including-ethics.jpeg\" alt class=\"lazyload img-responsive wp-image-61822\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27700%27%20height%3D%27594%27%20viewBox%3D%270%200%20700%20594%27%3E%3Crect%20width%3D%27700%27%20height%3D%27594%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/Article-Including-ethics-200x170.jpeg 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/Article-Including-ethics-400x339.jpeg 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/Article-Including-ethics-600x509.jpeg 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/Article-Including-ethics.jpeg 700w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 700px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-17\"><p>Daher ist es notwendig, geeignete data-Sammelprotokolle zu definieren und die Vielfalt der erhaltenen data zu analysieren und dem Team alle festgestellten L\u00fccken oder Risiken zu melden. Sie m\u00fcssen data so objektiv wie m\u00f6glich erheben. Zum Beispiel, indem Sie durch eine statistische Analyse sicherstellen, dass die Stichprobe repr\u00e4sentativ f\u00fcr die von Ihnen untersuchte Population oder Gruppe ist, und indem Sie so weit wie m\u00f6glich Daten aus verschiedenen Quellen kombinieren, um die Vielfalt der data zu gew\u00e4hrleisten.<br \/>\nDie Dokumentation der Ergebnisse und des gesamten data-Erfassungsprozesses ist obligatorisch.<\/p>\n<\/div><div class=\"fusion-text fusion-text-18\"><p>Es gibt in der Tat viele m\u00f6gliche Quellen f\u00fcr Voreingenommenheit, die in vielen Formen existieren k\u00f6nnen, von denen einige zu Unfairness bei verschiedenen nachgelagerten Lernaufgaben f\u00fchren k\u00f6nnen.<br \/>\nDa das Herzst\u00fcck \u00fcberwachter Algorithmen f\u00fcr maschinelles Lernen das Training data ist, k\u00f6nnen Modelle ihr Verhalten aus data lernen, das unter der Einbeziehung unbeabsichtigter historischer oder statistischer Verzerrungen leiden kann.\u00a0<strong>Historische Voreingenommenheit<\/strong>\u00a0k\u00f6nnen in den data-Generierungsprozess eindringen, selbst wenn die Stichproben und die Auswahl der Merkmale perfekt sind. Das Fortbestehen dieser Verzerrungen k\u00f6nnte zu einer unbeabsichtigten Diskriminierung bestimmter Gruppen oder Einzelpersonen f\u00fchren, was Vorurteile und Ausgrenzung noch verst\u00e4rken kann.<\/p>\n<\/div><div class=\"fusion-text fusion-text-19\"><p>Nicht alle Ursachen f\u00fcr Verzerrungen sind in data zu suchen. Die gesamte Pipeline des maschinellen Lernens umfasst eine Reihe von Entscheidungen und Praktiken, von der data-Vorverarbeitung bis zum Einsatz der Modelle.<br \/>\nEs ist nicht einfach, von Anfang an zu erkennen, ob und wie Probleme entstehen k\u00f6nnten. Eine gr\u00fcndliche Analyse ist erforderlich, um aufkommende Probleme zu erkennen. Je nach Anwendungsfall, der Art des data und dem Ziel der Aufgabe kommen unterschiedliche Methoden zur Anwendung.<br \/>\nIn diesem Abschnitt werden wir anhand eines anschaulichen Anwendungsfalls einige Techniken zur Identifizierung und Milderung von ethischen Verzerrungen untersuchen. Wir erl\u00e4utern zun\u00e4chst das Problem, dann sehen wir uns an, wie man Verzerrungen messen kann, und schlie\u00dflich wenden wir einige Techniken an, um Verzerrungen bei der Vorverarbeitung, bei der Verarbeitung und bei der Nachverarbeitung abzuschw\u00e4chen.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-9 fusion-sep-none fusion-title-text fusion-title-size-four\" style=\"--awb-margin-bottom-small:8px;\"><h4 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Problemstellung<\/h4><\/div><div class=\"fusion-text fusion-text-20\"><p>Nehmen wir an, Sie entwickeln einen Scoring-Algorithmus im Bankensektor, um die targeting von Kunden zu automatisieren, die von einem Premium-Gesch\u00e4ft profitieren oder nicht. Sie erhalten ein historisches data-Set, das viele aussagekr\u00e4ftige data-Merkmale \u00fcber Ihre Kunden sowie das bin\u00e4re Ziel \u201cgeeignet f\u00fcr ein Premium-Gesch\u00e4ft\u201d enth\u00e4lt. PII-Elemente (personenbezogene Daten) wurden zuvor aus dem dataset entfernt, so dass es keine Probleme mit dem Datenschutz gibt (in diesem Zusammenhang ist der Google cloud data Loss Prevention Service ein gro\u00dfartiges Werkzeug, um die Aufgabe der De-Identifizierung Ihrer sensiblen data durchzuf\u00fchren).<br \/>\nDieser Anwendungsfall mag etwas fiktiv erscheinen, aber das Problem ist einem realen Anwendungsfall sehr \u00e4hnlich, mit dem wir uns in der Vergangenheit in einem anderen Sektor besch\u00e4ftigt haben.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-10 fusion-sep-none fusion-title-text fusion-title-size-four\" style=\"--awb-margin-bottom-small:8px;\"><h4 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Bias messen<\/h4><\/div><div class=\"fusion-text fusion-text-21\"><p>Der erste Schritt der Analyse besteht darin, die data zu untersuchen, um empfindliche Merkmale, den privilegierten Wert und das g\u00fcnstige Label zu identifizieren.<\/p>\n<p><strong>Empfindliche Merkmale\u00a0<\/strong>(oder manchmal auch\u00a0<strong>gesch\u00fctzte Attribute<\/strong>) sind Merkmale, die eine Bev\u00f6lkerung in Gruppen aufteilen, die in Bezug auf den Leistungsbezug gleichberechtigt sein sollten. Diese Merkmale k\u00f6nnen ein diskriminierendes Potenzial gegen\u00fcber bestimmten Untergruppen haben. Zum Beispiel: Geschlecht, Geschlecht, Alter, Familienstand, sozio\u00f6konomische Einstufung, Familienstand usw. und alle daraus abgeleiteten Proxy-Merkmale data (z.B. geografischer Standort oder Rechnungsbetr\u00e4ge k\u00f6nnen als Proxy-Merkmale f\u00fcr die sozio\u00f6konomische Einstufung dienen, da in einigen Situationen beobachtet wurde, dass sie stark korreliert sein k\u00f6nnen) sind sensible Merkmale.<\/p>\n<p>A<strong> privilegierter Wert<\/strong>\u00a0eines sensiblen Merkmals bezeichnet eine Gruppe, die in der Vergangenheit einen systematischen Vorteil hatte.<\/p>\n<\/div><div class=\"fusion-text fusion-text-22\"><p>A <strong>g\u00fcnstiges Etikett<\/strong>\u00a0W\u00e4hrend der Vorbereitungsphase des data k\u00f6nnen Schritte wie die Aufteilung des data, Unter- oder \u00dcberstichproben, der Umgang mit fehlenden Werten und Ausrei\u00dfern zu Verzerrungen f\u00fchren, wenn sie nicht sorgf\u00e4ltig durchgef\u00fchrt werden. Der Anteil der fehlenden Werte oder Ausrei\u00dfer in den Untergruppen bei sensiblen Merkmalen kann ein erster Schritt sein, um Verzerrungen zu erkennen. Einige Imputationsstrategien k\u00f6nnen zu statistischen Verzerrungen f\u00fchren, z. B. die Imputation der fehlenden Werte f\u00fcr das Merkmal Alter des Kunden durch den Median.<\/p>\n<p>In unserem Scoring-Beispiel haben wir eine Grafik erstellt, die zeigt, wie sich die Ausbildung data auf die Geschlechter verteilt, und zwar in Bezug auf die Zielvorgabe \u201cf\u00f6rderf\u00e4hig f\u00fcr ein Premiumgesch\u00e4ft\u201d:<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-3 hover-type-none\"><img decoding=\"async\" width=\"700\" height=\"324\" title=\"karim-si-larbi-blog\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/karim-si-larbi-blog.png\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/karim-si-larbi-blog.png\" alt class=\"lazyload img-responsive wp-image-61823\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27700%27%20height%3D%27324%27%20viewBox%3D%270%200%20700%20324%27%3E%3Crect%20width%3D%27700%27%20height%3D%27324%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/karim-si-larbi-blog-200x93.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/karim-si-larbi-blog-400x185.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/karim-si-larbi-blog-600x278.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/karim-si-larbi-blog.png 700w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 700px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-23\"><p>Wir k\u00f6nnen sehen, dass die Verteilung des Ziels zugunsten des Geschlechts unausgewogen ist\u00a0<em>M\u00e4nnlich<\/em>. Lassen Sie uns annehmen, dass der Privilegierungswert\u00a0<em>M\u00e4nnlich<\/em>\u00a0wobei\u00a0<em>Geschlecht<\/em> ist ein sensibles Merkmal und das g\u00fcnstige Etikett ist \u201cberechtigt f\u00fcr ein Premium-Gesch\u00e4ft\u201d. Au\u00dferdem k\u00f6nnte dies zu einer Verzerrung der Darstellung im data f\u00fchren. In einem Fall, in dem die Gleichheit respektiert wird, k\u00f6nnte man sicherstellen, dass die Verteilungen im data vollst\u00e4ndig ausgeglichen sind oder den Verteilungen im demografischen data entsprechen.<\/p>\n<p>An diesem Punkt k\u00f6nnten Sie versucht sein, die sensiblen Merkmale einfach aus Ihrem dataset zu entfernen, aber es hat sich gezeigt, dass das Entfernen sensibler Attribute nicht unbedingt ausreicht, um Ihr Modell fair zu machen. Das Modell k\u00f6nnte andere Merkmale verwenden, die mit dem entfernten sensiblen Merkmal korrelieren und so historische Verzerrungen reproduzieren. Ein Beispiel: Ein Merkmal A k\u00f6nnte stark mit dem Alter eines Kunden korreliert sein. Wenn also das data gegen\u00fcber einer bestimmten Altersgruppe voreingenommen ist (historische Voreingenommenheit k\u00f6nnte zu Diskriminierung aufgrund des Alters bei Einstellungen, Bef\u00f6rderungen usw. f\u00fchren), wird diese Voreingenommenheit in Merkmal A kodiert und das Entfernen des Alters eines Kunden wird das Problem nicht l\u00f6sen. Wenn Sie die sensible Funktion in Ihrem data beibehalten, haben Sie eine bessere Kontrolle \u00fcber die Messung und Abschw\u00e4chung von Vorurteilen und Fairness.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-11 fusion-sep-none fusion-title-text fusion-title-size-four\" style=\"--awb-margin-bottom-small:8px;\"><h4 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Voreingenommene Metriken<\/h4><\/div><div class=\"fusion-text fusion-text-24\"><p>Es gibt eine Vielzahl von Fairness-Definitionen und Fairness-Metriken. Wir k\u00f6nnen Fairness unterteilen in\u00a0<strong>individuelle Fairness<\/strong>\u00a0und\u00a0<strong>Gruppenfairness<\/strong>. Die individuelle Fairness gibt \u00e4hnlichen Individuen \u00e4hnliche Prognosen, w\u00e4hrend die Gruppenfairness verschiedene Gruppen gleich behandelt.<\/p>\n<p>Um Gruppenfairness zu erreichen, wollen wir, dass die Wahrscheinlichkeit eines positiven Ergebnisses gleich ist, unabh\u00e4ngig davon, ob die Person in der gesch\u00fctzten Gruppe ist (z.B.,\u00a0<em>weiblich<\/em>) Gruppe oder nicht.<br \/>\nEine einfache Gruppenmetrik ist der Vergleich des Prozentsatzes der g\u00fcnstigen Ergebnisse f\u00fcr die privilegierten und nicht privilegierten Gruppen (in unserem Beispiel das Geschlecht\u00a0<em>M\u00e4nnlich<\/em>\u00a0die \u201cf\u00fcr ein Premiumangebot in Frage kommen\u201d im Vergleich zum Geschlecht\u00a0<em>Weiblich<\/em>\u00a0die \u201cf\u00fcr ein Premium-Gesch\u00e4ft in Frage kommen\u201d). Sie k\u00f6nnen diesen Vergleich als Differenz zwischen den beiden Prozents\u00e4tzen berechnen, was zu folgendem Ergebnis f\u00fchrt\u00a0<strong>statistische Parit\u00e4tsdifferenz<\/strong>\u00a0Metrik (auch genannt\u00a0<strong>demografische Parit\u00e4t<\/strong>):<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-4 hover-type-none\"><img decoding=\"async\" width=\"700\" height=\"17\" title=\"code-blog-Karim\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/code-blog-Karim.png\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/code-blog-Karim.png\" alt class=\"lazyload img-responsive wp-image-61828\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27700%27%20height%3D%2717%27%20viewBox%3D%270%200%20700%2017%27%3E%3Crect%20width%3D%27700%27%20height%3D%2717%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/code-blog-Karim-200x5.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/code-blog-Karim-400x10.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/code-blog-Karim-600x15.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/code-blog-Karim.png 700w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 700px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-25\"><p>Damit es keinen Unterschied bei den positiven Ergebnissen zwischen privilegierten und nicht privilegierten Gruppen gibt, sollte die statistische Parit\u00e4tsdifferenz gleich 0 sein.<br \/>\nZum Thema der individuellen Fairness-Metrik gibt es die\u00a0<strong>Konsistenz<\/strong>\u00a0die den Grad der \u00c4hnlichkeit von Etiketten f\u00fcr \u00e4hnliche Individuen mit Hilfe eines Algorithmus der n\u00e4chsten Nachbarn misst:<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-5 hover-type-none\"><img decoding=\"async\" width=\"700\" height=\"75\" title=\"blog-karim\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-karim.png\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-karim.png\" alt class=\"lazyload img-responsive wp-image-61829\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27700%27%20height%3D%2775%27%20viewBox%3D%270%200%20700%2075%27%3E%3Crect%20width%3D%27700%27%20height%3D%2775%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-karim-200x21.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-karim-400x43.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-karim-600x64.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-karim.png 700w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 700px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-26\"><p>Wir werden uns nicht mit diesem Thema befassen, aber der interessierte Leser kann dies nachlesen\u00a0<a class=\"ds iu\" href=\"http:\/\/proceedings.mlr.press\/v28\/zemel13.pdf\" rel=\"noopener nofollow\" target=\"_blank\">Artikel<\/a>.<br \/>\nSie k\u00f6nnen die praktische Bibliothek verwenden\u00a0<a class=\"ds iu\" href=\"https:\/\/github.com\/Trusted-AI\/AIF360\" rel=\"noopener nofollow\" target=\"_blank\">AIF360<\/a>\u00a0mit dem Sie viele Fairness-Metriken berechnen k\u00f6nnen.<br \/>\nAlles, was Sie tun m\u00fcssen, ist, Ihren dataframe in den\u00a0<em>StandardDataset<\/em>. AIF360 verwendet eine\u00a0<em>StandardDataset<\/em>\u00a0das einen Pandas DataFrame mit vielen Attributen und Methoden umh\u00fcllt, die speziell f\u00fcr die Verarbeitung und Messung ethischer Vorurteile gedacht sind. Sie k\u00f6nnen dies dann als Eingabe f\u00fcr das\u00a0<em>BinaryLabelDatasetMetric<\/em> Klasse, die eine Reihe von n\u00fctzlichen Metriken berechnet.<\/p>\n<\/div><div class=\"fusion-text fusion-text-27\"><div class=\"code\">\n<table class=\"highlight tab-size js-file-line-container\" data-tab-size=\"8\" data-paste-markdown-skip=\"\">\n<tbody>\n<tr>\n<td id=\"file-gist_for_medium_article-py-LC1\" class=\"blob-code blob-code-inner js-file-line\"><span class=\"pl-s1\">params_aif<\/span> <span class=\"pl-c1\">=<\/span> <\/td>\n<\/tr>\n<tr>\n<td id=\"file-gist_for_medium_article-py-L7\" class=\"blob-num js-line-number\" data-line-number=\"7\"><\/td>\n<td id=\"file-gist_for_medium_article-py-LC7\" class=\"blob-code blob-code-inner js-file-line\"><\/td>\n<\/tr>\n<tr>\n<td id=\"file-gist_for_medium_article-py-L8\" class=\"blob-num js-line-number\" data-line-number=\"8\"><\/td>\n<td id=\"file-gist_for_medium_article-py-LC8\" class=\"blob-code blob-code-inner js-file-line\"><span class=\"pl-c\"># Create aif360 StandardDatasets<\/span><\/td>\n<\/tr>\n<tr>\n<td id=\"file-gist_for_medium_article-py-L9\" class=\"blob-num js-line-number\" data-line-number=\"9\"><\/td>\n<td id=\"file-gist_for_medium_article-py-LC9\" class=\"blob-code blob-code-inner js-file-line\"><span class=\"pl-s1\">train_standard_dataset<\/span> <span class=\"pl-c1\">=<\/span> <span class=\"pl-v\">StandardDataset<\/span>(<span class=\"pl-s1\">df<\/span><span class=\"pl-c1\">=<\/span><span class=\"pl-s1\">train_dataframe<\/span>,<\/td>\n<\/tr>\n<tr>\n<td id=\"file-gist_for_medium_article-py-L10\" class=\"blob-num js-line-number\" data-line-number=\"10\"><\/td>\n<td id=\"file-gist_for_medium_article-py-LC10\" class=\"blob-code blob-code-inner js-file-line\"><span class=\"pl-c1\">**<\/span><span class=\"pl-s1\">params_aif<\/span>)<\/td>\n<\/tr>\n<tr>\n<td id=\"file-gist_for_medium_article-py-L11\" class=\"blob-num js-line-number\" data-line-number=\"11\"><\/td>\n<td id=\"file-gist_for_medium_article-py-LC11\" class=\"blob-code blob-code-inner js-file-line\"><\/td>\n<\/tr>\n<tr>\n<td id=\"file-gist_for_medium_article-py-L12\" class=\"blob-num js-line-number\" data-line-number=\"12\"><\/td>\n<td id=\"file-gist_for_medium_article-py-LC12\" class=\"blob-code blob-code-inner js-file-line\"><span class=\"pl-s1\">privilegierte_Gruppen<\/span> <span class=\"pl-c1\">=<\/span> []<\/td>\n<\/tr>\n<tr>\n<td id=\"file-gist_for_medium_article-py-L13\" class=\"blob-num js-line-number\" data-line-number=\"13\"><\/td>\n<td id=\"file-gist_for_medium_article-py-LC13\" class=\"blob-code blob-code-inner js-file-line\"><span class=\"pl-s1\">unprivilegierte_Gruppen<\/span> <span class=\"pl-c1\">=<\/span> []<\/td>\n<\/tr>\n<tr>\n<td id=\"file-gist_for_medium_article-py-L14\" class=\"blob-num js-line-number\" data-line-number=\"14\"><\/td>\n<td id=\"file-gist_for_medium_article-py-LC14\" class=\"blob-code blob-code-inner js-file-line\"><\/td>\n<\/tr>\n<tr>\n<td id=\"file-gist_for_medium_article-py-L15\" class=\"blob-num js-line-number\" data-line-number=\"15\"><\/td>\n<td id=\"file-gist_for_medium_article-py-LC15\" class=\"blob-code blob-code-inner js-file-line\"><span class=\"pl-s1\">train_bldm<\/span> <span class=\"pl-c1\">=<\/span> <span class=\"pl-v\">BinaryLabelDatasetMetric<\/span>(<span class=\"pl-s1\">train_standard_dataset<\/span>,<\/td>\n<\/tr>\n<tr>\n<td id=\"file-gist_for_medium_article-py-L16\" class=\"blob-num js-line-number\" data-line-number=\"16\"><\/td>\n<td id=\"file-gist_for_medium_article-py-LC16\" class=\"blob-code blob-code-inner js-file-line\"><span class=\"pl-s1\">unprivilegierte_Gruppen<\/span><span class=\"pl-c1\">=<\/span><span class=\"pl-s1\">unprivilegierte_Gruppen<\/span>,<\/td>\n<\/tr>\n<tr>\n<td id=\"file-gist_for_medium_article-py-L17\" class=\"blob-num js-line-number\" data-line-number=\"17\"><\/td>\n<td id=\"file-gist_for_medium_article-py-LC17\" class=\"blob-code blob-code-inner js-file-line\"><span class=\"pl-s1\">privilegierte_Gruppen<\/span><span class=\"pl-c1\">=<\/span><span class=\"pl-s1\">privilegierte_Gruppen<\/span>)<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div><div class=\"fusion-text fusion-text-28\"><p>Gemessen an unserem Trainingsbeispiel data stellen wir eine mittlere statistische Parit\u00e4tsdifferenz von -0,21 fest, was bedeutet, dass die privilegierte Gruppe\u00a0<em>M\u00e4nnlich<\/em>\u00a0hatte 21% mehr positive Ergebnisse in der Trainingsmenge data.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-12 fusion-sep-none fusion-title-text fusion-title-size-four\" style=\"--awb-margin-bottom-small:8px;\"><h4 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Abmilderung von Vorurteilen<\/h4><\/div><div class=\"fusion-text fusion-text-29\"><p>Methoden, die auf algorithmische Verzerrungen abzielen, werden normalerweise in drei Kategorien unterteilt:<\/p>\n<\/div><ul style=\"--awb-line-height:27.2px;--awb-icon-width:27.2px;--awb-icon-height:27.2px;--awb-icon-margin:11.2px;--awb-content-margin:38.4px;\" class=\"fusion-checklist fusion-checklist-1 fusion-checklist-default type-icons\"><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>Vorverarbeitung.<\/strong> Die Vorverarbeitungstechniken wirken auf die Trainingsdaten data ein und versuchen, sie so umzuwandeln, dass die zugrunde liegende Diskriminierung beseitigt wird.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>In Bearbeitung.<\/strong> In-Processing-Techniken wirken auf die Lernalgorithmen ein, um Diskriminierung w\u00e4hrend des Modelltrainings zu beseitigen, indem sie entweder \u00c4nderungen in die Zielfunktion aufnehmen oder eine Einschr\u00e4nkung auferlegen.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\"><strong>Nachbearbeitung<\/strong>. Nachbearbeitungstechniken, die ein bereits trainiertes Modell nehmen und seine Vorhersagen so umwandeln, dass sie die durch die gew\u00e4hlte Fairness-Metrik implizierten Beschr\u00e4nkungen erf\u00fcllen. Dies ist besonders dann n\u00fctzlich, wenn der Algorithmus das gelernte Modell nur als Black Box behandeln kann, ohne die M\u00f6glichkeit, das Training data oder den Lernalgorithmus zu ver\u00e4ndern.<\/div><\/li><\/ul><div class=\"fusion-text fusion-text-30\"><p>Wir haben die data-Trainingsdaten einer Vorverarbeitung unterzogen, um die statistische Parit\u00e4tsdifferenz zu optimieren. Wir haben die\u00a0<em>Erneutes Wiegen<\/em>\u00a0Algorithmus (mehr Details in diesem\u00a0<a class=\"ds iu\" href=\"https:\/\/core.ac.uk\/download\/pdf\/81728147.pdf\" rel=\"noopener nofollow\" target=\"_blank\">Artikel<\/a><a class=\"ds iu\" href=\"https:\/\/core.ac.uk\/download\/pdf\/81728147.pdf)\" rel=\"noopener nofollow\" target=\"_blank\">)<\/a>\u00a0die in AIF360 implementiert ist, um die Beispiele in jeder Kombination (Gruppe, Label) unterschiedlich zu gewichten, um vor der Klassifizierung Fairness zu gew\u00e4hrleisten.<\/p>\n<\/div><div class=\"fusion-text fusion-text-31\"><div class=\"code\">\n<table class=\"highlight tab-size js-file-line-container\" data-tab-size=\"8\" data-paste-markdown-skip=\"\">\n<tbody>\n<tr>\n<td id=\"file-gist_for_medium_article-py-LC1\" class=\"blob-code blob-code-inner js-file-line\"><\/td>\n<\/tr>\n<tr>\n<td id=\"file-gist_for_medium_article-py-L2\" class=\"blob-num js-line-number\" data-line-number=\"2\">\n<pre>RW = Rewighing(unprivileged_groups=unprivileged_groups,\n                privilegierte_Gruppen=privilegierte_Gruppen)\n\nreweighted_train = RW.fit_transform(train_standard_dataset)<\/pre>\n<\/td>\n<td id=\"file-gist_for_medium_article-py-LC2\" class=\"blob-code blob-code-inner js-file-line\"><\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<\/div>\n<\/div><div class=\"fusion-text fusion-text-32\"><p>Das Attribut Instanzgewichte wurde ge\u00e4ndert, um das empfindliche Merkmal in Bezug auf das Ziel neu auszubalancieren. Auf diese Weise wird die\u00a0<em>Erneutes Wiegen<\/em>\u00a0Algorithmus hat die Gruppenverzerrung beim Training data abgeschw\u00e4cht: ein neues Ma\u00df f\u00fcr die statistische Parit\u00e4tsdifferenz wurde vollst\u00e4ndig von -0,21 auf 0 umgestellt.<\/p>\n<p>In AIF360 sind weitere Algorithmen zur Reduzierung von Verzerrungen bei der Vorverarbeitung implementiert, wie z.B. der\u00a0<em>DisparateImpactRemover<\/em>\u00a0eine Technik, die die Merkmalswerte bearbeitet, um die Fairness in den Gruppen zu erh\u00f6hen und gleichzeitig die Rangfolge innerhalb der Gruppen zu erhalten (weitere Informationen finden Sie im folgenden\u00a0<a class=\"ds iu\" href=\"https:\/\/arxiv.org\/abs\/1412.3756\" rel=\"noopener nofollow\" target=\"_blank\">Artikel<\/a>) oder\u00a0<em>LFR<\/em>\u00a0(Learning fair representation). Dabei handelt es sich um eine Vorverarbeitungstechnik, mit der eine latente Repr\u00e4sentation gefunden wird, die die data kodiert, aber Informationen \u00fcber die gesch\u00fctzten Attribute verschleiert (weitere Informationen finden Sie im folgenden\u00a0<a class=\"ds iu\" href=\"http:\/\/www.cs.toronto.edu\/~toni\/Papers\/icml-final.pdf\" rel=\"noopener nofollow\" target=\"_blank\">Artikel<\/a>).<\/p>\n<p>Wir haben dann zwei Klassifizierungsmodelle trainiert, eines mit den urspr\u00fcnglichen data und das andere mit den neu gewichteten data. Wir stellen fest, dass die Neugewichtung nur eine schwache Auswirkung auf die Leistung hatte. Es gingen 1% der\u00a0<a class=\"ds iu\" href=\"https:\/\/en.wikipedia.org\/wiki\/F-score\" rel=\"noopener nofollow\" target=\"_blank\">F1-Ergebnis<\/a>.<\/p>\n<\/div><div class=\"fusion-text fusion-text-33\"><p>Wir haben auch einen In-Processing-Algorithmus an unserem Anwendungsbeispiel ausprobiert:\u00a0<a class=\"ds iu\" href=\"https:\/\/arxiv.org\/abs\/1801.07593\" rel=\"noopener nofollow\" target=\"_blank\"><em>kontradiktorische Entbl\u00f6\u00dfung<\/em><\/a>\u00a0die die Metrik der Gruppenverzerrung (statistische Parit\u00e4tsdifferenz wurde durch 2 geteilt) bei geringer Verschlechterung der Modellleistung (ca. 1% auf dem F1-Score) deutlich verbesserte.<\/p>\n<p>Es kann also einen Kompromiss zwischen Leistung und Verzerrungsmetriken geben. Hier ist die Verschlechterung recht gering, aber in manchen Situationen k\u00f6nnte der Kompromiss akuter sein. Diese Informationen m\u00fcssen dem Team und den entsprechenden Interessengruppen mitgeteilt werden, damit diese entscheiden k\u00f6nnen, wie sie mit diesem Problem umgehen.<\/p>\n<p>Jetzt, da wir die Modelle trainiert haben, k\u00f6nnen wir ihre Vorhersagen untersuchen und nach einem Ungleichgewicht zwischen den Geschlechtern im Hinblick auf ein g\u00fcnstiges Ergebnis suchen. Es gibt viele Tools wie z.B.\u00a0<a class=\"ds iu\" href=\"https:\/\/github.com\/PAIR-code\/what-if-tool\" rel=\"noopener nofollow\" target=\"_blank\">Was-w\u00e4re-wenn-Tool<\/a>\u00a0oder\u00a0<a class=\"ds iu\" href=\"https:\/\/github.com\/dssg\/aequitas\" rel=\"noopener nofollow\" target=\"_blank\">Aequitas<\/a>\u00a0mit denen Sie das Verhalten trainierter Modelle f\u00fcr maschinelles Lernen untersuchen und die Modellleistung und Fairness in Untergruppen untersuchen k\u00f6nnen.<\/p>\n<p>Zur Veranschaulichung k\u00f6nnen Sie Aequitas verwenden, um Kreuztabellen und Visualisierungen zu erstellen, die verschiedene Verzerrungen und Leistungskennzahlen \u00fcber die Untergruppen verteilt darstellen. So k\u00f6nnen wir zum Beispiel schnell die True-Positive-Raten der Klassifikatoren vergleichen, die auf dem urspr\u00fcnglichen data und dem neu gewichteten data trainiert wurden. Wir sehen, dass diese Rate ausgeglichen ist und daher eine gr\u00f6\u00dfere Gleichheit zwischen den Geschlechtern in Bezug auf das g\u00fcnstige Ergebnis des Modells, f\u00fcr einen Premiumvertrag in Frage zu kommen, erm\u00f6glicht.<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-6 hover-type-none\"><img decoding=\"async\" width=\"1000\" height=\"381\" title=\"blog-2-Karim\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-2-Karim.png\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-2-Karim.png\" alt class=\"lazyload img-responsive wp-image-61834\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%271000%27%20height%3D%27381%27%20viewBox%3D%270%200%201000%20381%27%3E%3Crect%20width%3D%271000%27%20height%3D%27381%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-2-Karim-200x76.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-2-Karim-400x152.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-2-Karim-600x229.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-2-Karim-800x305.png 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-2-Karim.png 1000w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 1000px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-34\"><p>Als Nachbearbeitungstechnik haben wir mit der Klassifizierungsschwelle interagiert. Ein Klassifizierungsmodell liefert uns normalerweise die Wahrscheinlichkeiten, die mit der Realisierung jeder Klasse als Vorhersage verbunden sind. Diese Wahrscheinlichkeit kann unver\u00e4ndert verwendet oder in einen bin\u00e4ren Wert umgewandelt werden.<br \/>\nUm die Klasse zu ermitteln, die den ermittelten Wahrscheinlichkeiten entspricht, muss eine Klassifizierungsschwelle (auch Entscheidungsschwelle genannt) festgelegt werden. Jeder Wert, der \u00fcber diesem Schwellenwert liegt, entspricht der positiven Kategorie \u201ckommt f\u00fcr ein Pr\u00e4miengesch\u00e4ft in Frage\u201d und umgekehrt f\u00fcr Werte unter diesem Schwellenwert.<br \/>\nIndem wir die Leistungsmetrik und die Verzerrungsmetrik (hier 1 - ungleiche Auswirkungen) f\u00fcr alle Klassifizierungsschwellenwerte aufzeichnen, k\u00f6nnen wir den optimalen Schwellenwert definieren. Dies hilft uns, den richtigen Schwellenwert zu w\u00e4hlen, um die Leistung zu maximieren und die Verzerrung zu minimieren.<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-7 hover-type-none\"><img decoding=\"async\" width=\"1000\" height=\"364\" title=\"blog-4-Karim\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-4-Karim.png\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-4-Karim.png\" alt class=\"lazyload img-responsive wp-image-61835\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%271000%27%20height%3D%27364%27%20viewBox%3D%270%200%201000%20364%27%3E%3Crect%20width%3D%271000%27%20height%3D%27364%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-4-Karim-200x73.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-4-Karim-400x146.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-4-Karim-600x218.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-4-Karim-800x291.png 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-4-Karim.png 1000w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 1000px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-35\"><p>In der linken Abbildung sehen wir, dass wir die Bias-Metrik verbessern k\u00f6nnen, wenn wir den Schwellenwert nach links verschieben und damit die Leistung ein wenig senken.<br \/>\nAu\u00dferdem beobachten wir erwartungsgem\u00e4\u00df eine deutliche Verbesserung der Metriken f\u00fcr die Gruppenverzerrung bei dem neu gewichteten Modell (rechte Abbildung), die durch die Wahl eines anderen Klassifizierungsschwellenwerts weiter verbessert werden k\u00f6nnte, allerdings auf Kosten der Leistung.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-13 fusion-sep-none fusion-title-text fusion-title-size-three\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Erkl\u00e4rbarkeit<\/h3><\/div><div class=\"fusion-text fusion-text-36\"><p>Ein weiterer Grundpfeiler f\u00fcr den Aufbau vertrauensw\u00fcrdiger maschineller Lernmodelle ist die Erkl\u00e4rbarkeit. Erkl\u00e4rbarkeit ist die F\u00e4higkeit, sowohl die technischen Prozesse des KI-Systems als auch die Gr\u00fcnde f\u00fcr die Entscheidungen oder Vorhersagen, die das KI-System trifft, zu erl\u00e4utern und somit den Einfluss der einzelnen Merkmale\/Attribute auf die Vorhersagen zu quantifizieren. Die Verwendung leicht interpretierbarer Modelle anstelle von Black-Box-Modellen ist eine gute Praxis.<\/p>\n<p>Es gibt viele Methoden, um die Erkl\u00e4rbarkeit von Modellen zu erhalten. Diese Methoden k\u00f6nnen in 2 Kategorien eingeteilt werden:<\/p>\n<\/div><ul style=\"--awb-line-height:27.2px;--awb-icon-width:27.2px;--awb-icon-height:27.2px;--awb-icon-margin:11.2px;--awb-content-margin:38.4px;\" class=\"fusion-checklist fusion-checklist-2 fusion-checklist-default type-icons\"><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\"><strong>Intrinsische Erkl\u00e4rbarkeit\u00a0<\/strong>wobei das Modell selbst die Merkmalsbedeutung oder Merkmalsgewichtung angibt.<\/p>\n<p><strong>Post-hoc-Erkl\u00e4rbarkeit<\/strong>\u00a0wo kleine \u00c4nderungen der Eingaben genutzt werden, um die Wichtigkeit von Merkmalen abzuleiten.<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>In Bearbeitung.<\/strong> In-Processing-Techniken wirken auf die Lernalgorithmen ein, um Diskriminierung w\u00e4hrend des Modelltrainings zu beseitigen, indem sie entweder \u00c4nderungen in die Zielfunktion aufnehmen oder eine Einschr\u00e4nkung auferlegen.<\/p>\n<\/div><\/li><\/ul><div class=\"fusion-text fusion-text-37\"><p>Hier wenden wir eine ber\u00fchmte Post-Hoc-Methode an, n\u00e4mlich SHAP (SHapley Additive exPlanations). F\u00fcr weitere Informationen empfehlen wir Ihnen, sich mit\u00a0<a class=\"ds iu\" href=\"https:\/\/christophm.github.io\/interpretable-ml-book\/shap.html\" rel=\"noopener nofollow\" target=\"_blank\">diese sehr umfassende Ressource zu diesem Thema<\/a>.\u00a0<a class=\"ds iu\" href=\"https:\/\/github.com\/slundberg\/shap\" rel=\"noopener nofollow\" target=\"_blank\">Shap<\/a>\u00a0ist eine Bibliothek, die einen spieltheoretischen Ansatz zur Erkl\u00e4rung des Outputs eines beliebigen maschinellen Lernmodells implementiert.<br \/>\nLassen Sie uns die Auswirkungen des Reweighing-Algorithmus auf die Erkl\u00e4rbarkeit des Modells beobachten:<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-8 hover-type-none\"><img decoding=\"async\" width=\"700\" height=\"508\" title=\"blog-5-Karim\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-5-Karim.jpeg\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-5-Karim.jpeg\" alt class=\"lazyload img-responsive wp-image-61836\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27700%27%20height%3D%27508%27%20viewBox%3D%270%200%20700%20508%27%3E%3Crect%20width%3D%27700%27%20height%3D%27508%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-5-Karim-200x145.jpeg 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-5-Karim-400x290.jpeg 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-5-Karim-600x435.jpeg 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/07\/blog-5-Karim.jpeg 700w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 700px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-38\"><p>Kurze Erinnerung daran, wie man Shaps liest\u00a0<em>bienenwarm<\/em>\u00a0Grundst\u00fccke:<\/p>\n<\/div><ul style=\"--awb-line-height:27.2px;--awb-icon-width:27.2px;--awb-icon-height:27.2px;--awb-icon-margin:11.2px;--awb-content-margin:38.4px;\" class=\"fusion-checklist fusion-checklist-3 fusion-checklist-default type-icons\"><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Die Merkmale sind von oben nach unten sortiert, von den wichtigsten bis zu den unwichtigsten.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Die Farbe entspricht der Amplitude der Werte des Merkmals. Je roter die Farbe, desto niedriger der Wert und umgekehrt f\u00fcr Blau.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Die horizontale Achse entspricht der Richtung des Einflusses des Merkmals auf die Vorhersage des Ziels. In unserem Beispiel f\u00fcr die Bewertung werden negative Werte die Vorhersage in Richtung der Klasse \u201ckein Anspruch auf einen Premium-Deal\u201d beeinflussen und umgekehrt f\u00fcr positive Werte.<\/p>\n<\/div><\/li><\/ul><div class=\"fusion-text fusion-text-39\"><p>Auf der linken Seite sehen wir die Erkl\u00e4rungskraft des urspr\u00fcnglichen Modells. Wir stellen fest, dass in diesem Fall die Geschlechtsvariable eine sehr starke Vorhersagekraft hat und dass das Geschlecht\u00a0<em>Weiblich<\/em>\u00a0beeinflusst die Entscheidung f\u00fcr das Ziel \u201ckein Anspruch auf ein Pr\u00e4miengesch\u00e4ft\u201d mit einer gro\u00dfen Diskrepanz in Bezug auf das Geschlecht\u00a0<em>M\u00e4nnlich<\/em>.<\/p>\n<p>In der rechten Grafik sehen wir, dass in diesem Fall, in dem das Modell auf der neu gewichteten data trainiert wurde, die Bedeutung des Merkmals Geschlecht stark abgenommen hat. Es geh\u00f6rt jetzt zu den am wenigsten wichtigen Merkmalen. Au\u00dferdem ist der Einfluss der weiblichen gegen\u00fcber der m\u00e4nnlichen Klasse auf die Vorhersage des Ziels viel ausgewogener (die Farben liegen beim Shapley-Wert nahe bei 0).<\/p>\n<\/div><div class=\"fusion-title title fusion-title-14 fusion-sep-none fusion-title-text fusion-title-size-three\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">R\u00fcckverfolgbarkeit<\/h3><\/div><div class=\"fusion-text fusion-text-40\"><p>Ein weiterer wesentlicher Aspekt bei der Erstellung vertrauensw\u00fcrdiger Algorithmen f\u00fcr maschinelles Lernen ist die R\u00fcckverfolgbarkeit der Ergebnisse und eine gute Reproduzierbarkeit der Experimente. Dadurch l\u00e4sst sich leicht feststellen, welche Version eines Modells in Produktion gegangen ist, so dass es \u00fcberpr\u00fcft werden kann, wenn sein Verhalten Schaden anrichtet und nicht mehr mit den ethischen Werten des Unternehmens \u00fcbereinstimmt.<\/p>\n<p>Dazu muss man in der Lage sein, jede Modellversion und die damit verbundenen Trainings data, Hyperparameter und Ergebnisse zu verfolgen und aufzuzeichnen. Mehrere Tools k\u00f6nnen diese Aufgabe erf\u00fcllen:\u00a0<a class=\"ds iu\" href=\"https:\/\/mlflow.org\/docs\/latest\/index.html\" rel=\"noopener nofollow\" target=\"_blank\">Mlflow<\/a>\u00a0ist eine gro\u00dfartige Option, mit der Sie schnell eine Weboberfl\u00e4che erstellen k\u00f6nnen, die alle L\u00e4ufe zentralisiert, w\u00e4hrend Sie Ihre Artefakte in einem Speicher Ihrer Wahl speichern. Jede Version des Experiments kann mit dem Hash des zugeh\u00f6rigen Commits nachverfolgt werden. Jede dieser Versionen enth\u00e4lt alle Elemente, die von MLflow aufgezeichnet wurden.<\/p>\n<p>Hier ist eine\u00a0<a class=\"ds iu\" href=\"https:\/\/github.com\/artefactory\/one-click-mlflow\" rel=\"noopener nofollow\" target=\"_blank\">Werkzeug<\/a>\u00a0das wir bei Artefact als Open Source zur Verf\u00fcgung gestellt haben, mit dem Sie einen sicheren MLflow in einem GCP-Projekt mit einem einzigen Befehl einsetzen k\u00f6nnen.<\/p>\n<p>Es ist auch eine gute Praxis, eine\u00a0<a class=\"ds iu\" href=\"https:\/\/aifs360.mybluemix.net\/introduction\" rel=\"noopener nofollow\" target=\"_blank\">FactSheet<\/a>\u00a0f\u00fcr jedes Modell, das einer Modellidentit\u00e4tskarte entspricht, in der verschiedene Elemente zusammengefasst sind, die die Vorverarbeitungsschritte, Leistungsmetriken, Verzerrungsmetriken usw. nachzeichnen.<\/p>\n<p>Diese Ausweise werden von den data-Wissenschaftlern an die Betreiberteams der Modelle \u00fcbergeben, damit diese feststellen k\u00f6nnen, ob das Modell f\u00fcr ihre Situation geeignet ist. F\u00fcr weitere Einzelheiten \u00fcber die Methodik zur Erstellung eines FactSheets empfehlen wir dieses\u00a0<a class=\"ds iu\" href=\"https:\/\/arxiv.org\/pdf\/2006.13796.pdf\" rel=\"noopener nofollow\" target=\"_blank\">Artikel<\/a>. Das FactSheet kann auch, z.B. in Tabellenform, in MLFlow zusammen mit dem zugeh\u00f6rigen Modell gespeichert werden.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-15 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Wie man die Ethik nach dem Einsatz weiterverfolgt<\/h2><\/div><div class=\"fusion-text fusion-text-41\"><p>Sobald Ihr Modell zum Einsatz kommt, m\u00fcssen Sie sicherstellen, dass es f\u00fcr den Zweck verwendet wird, f\u00fcr den es gedacht, entworfen und erstellt wurde. Eine Verzerrung des Einsatzes liegt dann vor, wenn es eine Diskrepanz zwischen dem Problem, das ein Modell l\u00f6sen soll, und der Art und Weise, wie es tats\u00e4chlich verwendet wird, gibt. Dies geschieht h\u00e4ufig, wenn ein System so entwickelt und bewertet wird, als ob es v\u00f6llig eigenst\u00e4ndig w\u00e4re, w\u00e4hrend es in Wirklichkeit Teil eines komplexen soziotechnischen Systems ist, das von einer gro\u00dfen Anzahl von Entscheidungstr\u00e4gern gesteuert wird.<\/p>\n<p>data aus der Produktion k\u00f6nnen im Laufe der Zeit abdriften, was zu einer Verschlechterung der Algorithmusleistung f\u00fchren kann, die zu Verzerrungen f\u00fchren k\u00f6nnte. Die Verfolgung der data-Qualit\u00e4t in der Produktion und der data-Drift durch \u00dcberwachung der Verteilungen der neuen data im Vergleich zu den data, die zum Trainieren der Modelle verwendet wurden, sollte ein Schritt in der Produktionspipeline sein, um bei Bedarf die richtigen Warnungen auszul\u00f6sen und festzulegen, wann ein erneutes Training erforderlich ist.<\/p>\n<p>Die Produktionspipeline sollte so konzipiert sein, dass es eine M\u00f6glichkeit gibt, das aktuelle Modell abzuschalten oder zu einer fr\u00fcheren Version zur\u00fcckzukehren.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-16 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Fazit<\/h2><\/div><div class=\"fusion-text fusion-text-42\"><p>In diesem Artikel stellen wir Ihnen einige bew\u00e4hrte Verfahren und Protokolle vor, die Sie beim Aufbau von Pipelines f\u00fcr maschinelles Lernen unterst\u00fctzen und das Risiko, in ethische Fallen zu tappen, minimieren.<\/p>\n<\/div><div class=\"fusion-text fusion-text-43\"><p>Dieser Artikel hat kaum an der Oberfl\u00e4che des riesigen Themas der ethischen KI gekratzt und nur einen kleinen Ausschnitt der\u00a0<a class=\"ds iu\" href=\"https:\/\/github.com\/EthicalML\/awesome-production-machine-learning#explaining-black-box-models-and-datasets\" rel=\"noopener nofollow\" target=\"_blank\">interessante Werkzeuge<\/a>\u00a0entwickelt, die jetzt verf\u00fcgbar sind.<br \/>\nWie wir gesehen haben, besteht der logischste Weg, Fairnessprobleme explizit anzugehen, darin, eine Sammlung ausgew\u00e4hlter Merkmale als potenziell diskriminierend zu deklarieren und dann durch dieses Prisma ethische Voreingenommenheit zu untersuchen. Diese einfache Technik hat jedoch den Fehler, dass Diskriminierung das Ergebnis einer Kombination von Merkmalen sein kann, die f\u00fcr sich genommen nicht diskriminierend sind. Au\u00dferdem werden Sie in vielen F\u00e4llen keinen Zugang zu einem sensiblen Merkmal haben (mehr zu diesem Thema\u00a0<a class=\"ds iu\" href=\"https:\/\/arxiv.org\/pdf\/2011.02282.pdf\" rel=\"noopener nofollow\" target=\"_blank\">Hier<\/a>).<br \/>\nDie Bewertung der Fairness ist eine komplexe Aufgabe, die von der Art des Problems abh\u00e4ngt. Die Herangehensweise an ein Bewertungsproblem auf der Grundlage von data-Tabellen ist nicht dieselbe wie\u00a0<a class=\"ds iu\" href=\"https:\/\/arxiv.org\/abs\/1906.08976\" rel=\"noopener nofollow\" target=\"_blank\">Abschw\u00e4chen von Verzerrungen bei der Verarbeitung nat\u00fcrlicher Sprache<\/a>.<\/p>\n<\/div><div class=\"fusion-text fusion-text-44\"><p>Wir hoffen, dass der Austausch \u00fcber unsere Sichtweise und Methoden Sie bei Ihren eigenen Projekten inspirieren wird! Vielen Dank f\u00fcr die Lekt\u00fcre, z\u00f6gern Sie nicht, der Artefact tech zu folgen\u00a0<a class=\"ds iu\" href=\"https:\/\/medium.com\/artefact-engineering-and-data-science\" rel=\"noopener\" target=\"_blank\">Blog<\/a>\u00a0wenn Sie benachrichtigt werden m\u00f6chten, wenn unser n\u00e4chster Artikel erscheint!<\/p>\n<\/div><\/div><\/div><\/div><\/article><\/p>","protected":false},"excerpt":{"rendered":"<p>27. Juli 2021<br \/>\nHier sind einige Richtlinien, um vertrauensw\u00fcrdige L\u00f6sungen f\u00fcr maschinelles Lernen zu entwickeln, ohne in ethische Fallen zu tappen.<\/p>","protected":false},"featured_media":68681,"parent":0,"template":"","meta":{"_acf_changed":false,"ep_exclude_from_search":false},"blog-category":[21939],"blog-language":[2991],"class_list":["post-61815","blog","type-blog","status-publish","has-post-thumbnail","hentry","blog-category-medium","blog-language-en"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/blog\/61815","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/blog"}],"about":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/types\/blog"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/media\/68681"}],"wp:attachment":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/media?parent=61815"}],"wp:term":[{"taxonomy":"blog-category","embeddable":true,"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/blog-category?post=61815"},{"taxonomy":"blog-language","embeddable":true,"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/blog-language?post=61815"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}