Les risques liés à l'utilisation massive de artificial intelligence résident principalement dans la reproduction des préjugés et des stéréotypes humains. Pour créer une IA éthique, les développeurs doivent créer des solutions d'IA data-driven dignes de confiance en les concevant d'une manière technique, juridique et humaniste.
La science-fiction regorge d'histoires d'IA rebelles, où les machines agissent selon leur propre système de valeurs néfastes. Souvenez-vous de HAL 9000 dans L'Odyssée de l'espace ou de Skynet dans Terminator. Mais dans la vie réelle, les systèmes et algorithmes d'IA ont été largement intégrés dans les activités quotidiennes telles que les achats en ligne, les demandes de prêts ou la consultation des réseaux sociaux. Si les cas d'IA renégate restent heureusement l'apanage des auteurs, les dérives et dysfonctionnements de l'IA sont devenus monnaie courante, et ils ont souvent des conséquences bien réelles.
Lutter contre les stéréotypes par l'éthique
Nous avons tous vu les images générées par des IA comme Dall-E 2. Il est innocent de créer l'image d'un ours en peluche écoutant de la musique sous l'eau. Mais savez-vous que les algorithmes utilisés perpétuent les stéréotypes de genre en surreprésentant les hommes dans les images de médecins, de pilotes et de PDG, tout en surreprésentant les women dans les images d'infirmières, d'hôtesses de l'air et de secrétaires ?
Compte tenu du nombre massif de décisions quotidiennes déléguées à l'IA, nous ne pouvons ignorer les questions éthiques soulevées par son utilisation. L'IA reste un marché et une technologie encore peu légiférés (même si la Commission européenne travaille activement à une future réglementation). Il est donc de la responsabilité de chacun de protéger les utilisateurs.
Le défi de l'IA est de créer des systèmes dignes de confiance. par conception qui répondent aux attentes éthiques de notre société. Il est impératif que nous nous préparions, dès maintenant, à concevoir et à maintenir des systèmes d'IA fiables. Il s'agit d'une vaste entreprise : l'éthique est un sujet qui se construit tout au long du cycle de vie d'un produit.
L'intelligence artificielle qui reproduit les erreurs humaines
L'intelligence artificielle est un ensemble de théories et de techniques qui permettent à une machine de prendre des décisions face à une situation prédéfinie. En d'autres termes, elle simule l'intelligence humaine. Ces programmes peuvent être déterministe, où des règles successives sont appliquées selon un schéma décisionnel, ou probabiliste, Il s'agit d'un programme qui, après avoir tiré des enseignements de situations antérieures similaires, peut déduire à quoi devrait ressembler la ‘bonne’ décision. C'est ce que l'on appelle aussi l'apprentissage automatique.
Quel que soit le type de programme, l'IA est l'automatisation de la prise de décision. Les risques éthiques ne résident pas dans le fait que l'IA puisse mal automatiser, mais au contraire qu'elle imite parfaitement les décisions humaines, avec leur lot d'erreurs et de biais. Beaucoup de ces dysfonctionnements proviennent du contexte culturel dans lequel l'IA a été développée, lorsqu'elle reproduit les systèmes de valeurs historiques d'une société (inégalité de genre ou ethnique, par exemple) ou ceux de ses concepteurs (éducation, sensibilité politique, pratiques religieuses, etc.).
Ces biais sont particulièrement fréquents dans les algorithmes d'apprentissage automatique puisqu'ils sont formés sur des bases data existantes, déduisant l'avenir à partir du passé.
Les questions essentielles liées à la conception et au développement d'un cycle de vie de l'IA digne de confiance concernent à la fois des aspects techniques et éthiques, tels que : comment détecter de manière fiable les éventuels biais d'une IA ? Comment interpréter les résultats d'un modèle ? Peut-on mesurer l'évolution des performances d'une IA ? Quelles garanties de sécurité pouvons-nous fournir ? Peut-on réagir à une dérive ? Cette liste non exhaustive reflète la diversité des défis à relever lors de la production d'une IA.
Utiliser l'IA pour corriger les biais de l'IA
Alors que les modèles d'IA sont passés du stade de concepts à celui de produits, de nombreuses solutions techniques ont été créées pour faciliter l'automatisation et le déploiement des systèmes d'IA. Récemment, le nombre de solutions techniques disponibles a explosé, créant un riche écosystème alimenté par l'innovation constante des start-ups et des leaders de l'industrie. Parmi les exemples notables, on peut citer le Alliance pour l'infrastructure de l'IA et le Communauté MLOps, dont Artefact est membre. Trouver le bon outil pour la bonne tâche devient donc de plus en plus important, et de plus en plus difficile.
Parallèlement, un écosystème tout aussi dynamique de cabinets de conseil s'est développé pour aider leurs clients à faire ces choix stratégiques.
Nombre de ces solutions techniques existent en open source et sont librement accessibles à tous. Ces boîtes à outils permettent de détecter et de mesurer les biais tout au long de la chaîne de traitement des data : de la collecte à l'exploitation, en passant par la transformation et la modélisation. Ces solutions doivent être mises en œuvre tout au long du cycle de vie du produit, tant au niveau de la conception et du développement qu'au niveau de la production, afin d'assurer une correction permanente. Trois domaines particuliers peuvent être traités par des solutions techniques.
“Les préjugés ne viennent pas des scientifiques de data, ils viennent de datasets.”
Corriger les biais du passé dans l'IA
Les préjugés ne proviennent pas des scientifiques data, mais des datasets. C'est pourquoi il est nécessaire d'explorer et de réfléchir en profondeur aux dataensembles en premier lieu. Les biais peuvent être à la fois techniques (variables omises, database ou problèmes de sélection) et sociaux (économiques, cognitifs, émotionnels).
Pour rectifier les jeux d'entraînement, il pourrait sembler logique d'effacer toute trace de data sensible. Cependant, cela serait aussi inutile que dangereux : d'une part, parce que data non sensible peut être insidieusement corrélée à data sensible, et d'autre part parce que ce type de raccourci incite à limiter les contrôles réguliers de data et des processus.
Pour détecter ces biais, il faut être conscient de leur existence et savoir à quoi s'attendre. Il est important de comprendre le contexte du data afin de l'interpréter correctement. Un programme unique ne peut pas identifier les biais, d'où l'importance d'équipes diversifiées de scientifiques du data.
C'est en réfléchissant de manière critique aux différentes mesures associées à un modèle d'IA que nous pouvons identifier et rectifier les problèmes. Prenons l'exemple d'un modèle qui doit détecter une maladie présente chez 1% de la population. Si le modèle prédit toujours que la personne est en bonne santé, il aura un taux de précision de 99%. Sans contexte, il s'agit d'un excellent score. Pourtant, ce modèle est inutile.
L'utilisation de statistiques de base, univariées et bivariées dataset permet d'identifier certains biais. Par exemple, chaque groupe d'âge est-il représenté de manière suffisamment égale ? Une solution pourrait consister à remplacer les data continues par des data catégorielles. Les matrices de corrélation permettent également de valider les liens entre deux variables liées. Tout ce travail en amont est crucial pour s'assurer que les modèles sont entraînés sur des ensembles de data de qualité. En résumé : “Garbage in, garbage out”.
Expliquer les résultats d'un modèle
Les systèmes d'IA performants, tels que les réseaux neuronaux artificiels, sont très efficaces et utilisés dans de nombreux cas. Cependant, ils sont difficiles à interpréter, c'est pourquoi on les appelle souvent des “modèles de boîte noire”. Le grand défi de l'apprentissage automatique est d'identifier et d'expliquer la cause des biais plutôt que d'en rejeter les conséquences. Il y a un compromis à faire entre l'explicabilité et la précision. Certains algorithmes, comme les arbres de décision, sont très explicables, mais moins utiles pour les prédictions plus complexes.
Le domaine de l'IA explicable (Ex-AI) tente de résoudre ce problème en développant des méthodes et des algorithmes qui augmentent la capacité d'explication des systèmes. On peut explorer soit la compréhension globale, qui explique comment une IA fonctionne sur la population mondiale, soit la compréhension locale, qui explique comment l'algorithme fonctionne sur un exemple spécifique. Ce dernier point est imposé par le GDPR car, pour être transparente, une IA doit être en mesure d'expliquer pourquoi le modèle a pris une certaine décision pour une personne/objet/data ligne particulière. Il est important d'examiner la compréhension globale et locale pour comprendre comment le modèle se comporte.
Pour ce faire, les scientifiques de data peuvent examiner les variables importantes du modèle. Par exemple, il n'est pas normal qu'un modèle de recrutement ait le sexe comme variable importante. Ils peuvent également vérifier des paramètres tels que précision (nombre de positifs bien prédits = vrai positif divisé par tous les positifs prédits = vrai positif + faux positif), score F1 (résume les valeurs de la précision et de l'exactitude). rappel dans une seule métrique), ou rappel (nombre de positifs bien prédits = vrai positif divisé par tous les positifs = vrai positif + faux négatif), par rapport à une variable (par exemple, précision pour women par rapport aux hommes).
“Le grand défi de l'apprentissage automatique est d'identifier et d'expliquer la cause des préjugés plutôt que d'en rejeter les conséquences.”
Améliorer la robustesse d'un modèle
Les sources de dysfonctionnement des modèles d'intelligence artificielle peuvent être accidentelles, lorsque data est corrompu, ou intentionnelles, lorsqu'elles sont causées par des pirates informatiques par exemple. Ces deux sources de biais conduisent les modèles d'intelligence artificielle à commettre des erreurs en fournissant des prédictions ou des résultats incorrects. Certaines solutions permettent d'évaluer, de défendre et de vérifier les modèles et les applications d'apprentissage automatique contre des menaces contradictoires qui peuvent cibler le data (empoisonnement du data), le modèle (fuite du modèle) ou l'infrastructure sous-jacente, à la fois matérielle et logicielle.

Source des photos : https://arxiv.org/pdf/1412.6572.pdf
En superposant simplement une image ‘bruit’ à une image normale, un classificateur peut être amené à confondre un panda avec un gibbon. La différence est imperceptible pour l'œil humain, mais cette technique est bien documentée comme étant capable d'induire en erreur les modèles d'intelligence artificielle.
Développer des systèmes moins humains, mais plus humanistes
La notion d'IA digne de confiance ne peut être réduite à sa conception juridique et technique. Les aspects humains et organisationnels sont cruciaux pour le succès d'une approche éthique de l'IA. Les chartes éthiques et les solutions d'amélioration doivent être connues de toutes les parties prenantes, appliquées tout au long du processus de création et suivies dans le temps. Cela nécessite une transformation de la culture de l'organisation afin d'intégrer en profondeur les questions et les approches éthiques, de garantir la durabilité des solutions et de contribuer à une IA éthique. par conception.
L'IA en elle-même n'est ni éthique ni contraire à l'éthique. Ce n'est que la manière dont le système est formé ou utilisé qui est éthique ou non. Le véritable risque éthique lié à l'utilisation massive de l'IA n'est donc pas que les algorithmes se révoltent. Au contraire, le risque survient précisément lorsque l'IA se comporte exactement comme nous lui avons demandé de le faire, en imitant nos biais, en répétant nos erreurs et en renforçant nos incertitudes et nos imprécisions.
“Le risque survient précisément lorsque l'IA se comporte exactement comme nous lui avons demandé de le faire.”
Être proactif en matière d'IA éthique
Ce sujet nous tient à cœur à Artefact, C'est pourquoi nous y avons consacré des équipes et avons développé un soutien spécifique en matière de développement de la gouvernance, de mise en œuvre de solutions techniques et de conseil en stratégie d'IA.
Nous travaillons en étroite collaboration avec le monde universitaire, en tant que partenaire de la Bon dans la technologie cofondée par l'Institut Mines-Télécom et Sciences Po, pour réduire l'écart entre la recherche et la pratique. Artefact a également reçu le label Responsible and Trusted AI, décerné par l'association indépendante Labelia Labs, qui garantit un haut niveau de maturité en matière d'IA responsable et digne de confiance.
La question de l'éthique nous concerne tous et il est essentiel d'être proactif sur le sujet ; l'adoption d'un comportement éthique ne doit pas être une simple réaction. L'intelligence artificielle traverse une période évolutive, où ses processus et son éthique sont en cours de définition. Dans un domaine qui n'est pas encore réglementé, c'est à ceux qui jouent un rôle actif de prendre les devants. En tant que développeurs, consultants et managers, il est de notre responsabilité de répondre aux attentes de toutes les parties concernées - non seulement les clients et les utilisateurs de services, mais aussi la société en général - et d'utiliser le pouvoir de l'IA pour créer un monde meilleur.

NOUVELLES






