Trustworthy AI: new challenges and data-driven solutions

Lea el artículo en francés en

Los riesgos ligados al uso masivo de la artificial intelligence residen principalmente en la reproducción de sesgos y estereotipos humanos. Para crear una IA ética, los desarrolladores deben crear data-driven, soluciones de IA fiables mediante el diseño de forma técnica, legal y humanista.

La ciencia ficción está repleta de historias de IAs rebeldes, en las que las máquinas actúan según sus propios y nefastos sistemas de valores. ¿Recuerda a HAL 9000 en Odisea del espacio o a Skynet en Terminator? Pero en la vida real, los sistemas y algoritmos de IA se han integrado ampliamente en actividades cotidianas como las compras en línea, la solicitud de préstamos o la consulta de redes sociales. Aunque los casos de IA renegada siguen siendo felizmente la fantasía de los autores, los desvíos y los fallos de funcionamiento de la IA se han convertido en algo habitual, y a menudo tienen consecuencias muy reales.

Luchar contra los estereotipos con ética

Todos hemos visto las imágenes generadas por IAs como Dall-E 2. Es inocentemente divertido crear una imagen de un osito de peluche escuchando música bajo el agua. Pero, ¿es consciente de que la algoritmos utilizados perpetúan los estereotipos de género al sobrerrepresentar a los hombres en las imágenes de médicos, pilotos y directores ejecutivos, mientras que sobrerrepresentan a los women en las imágenes de enfermeras, auxiliares de vuelo y secretarias?

Dado el enorme número de decisiones cotidianas que se delegan en la IA, no podemos ignorar las cuestiones éticas que plantea su uso. La IA sigue siendo un mercado y una tecnología poco legislados (aunque la Comisión Europea trabaja activamente en una futura normativa). Por lo tanto, es responsabilidad de cada individuo proteger a los usuarios.

El reto de la IA es crear sistemas fiables por diseño que satisfagan las expectativas éticas de nuestra sociedad. Es imperativo que nos preparemos, desde ahora, para diseñar y mantener sistemas de IA fiables. Se trata de una vasta empresa: la ética es un tema que se construye a lo largo de todo el ciclo de vida de un producto.

Inteligencia artificial que reproduce los errores humanos

La Inteligencia Artificial es un conjunto de teorías y técnicas que permiten a una máquina tomar decisiones ante una situación predefinida. En otras palabras, simula la inteligencia humana. Estos programas pueden ser determinista, donde se aplican reglas sucesivas según un esquema de toma de decisiones, o probabilístico, en la que, tras aprender de situaciones pasadas similares, el programa puede inferir cómo debería ser la decisión ‘correcta’. Esto también se denomina aprendizaje automático.

Independientemente del tipo de programa, la IA es la automatización de la toma de decisiones. Los riesgos éticos no residen en que la IA automatice mal, sino al contrario, en que imite a la perfección las decisiones humanas, con su carga de errores y sesgos. Muchas de estas disfunciones proceden del contexto cultural en el que se ha desarrollado la IA, cuando reproduce los sistemas de valores históricos de una sociedad (desigualdad de género o étnica, por ejemplo) o los de sus diseñadores (educación, sensibilidad política, prácticas religiosas, etc.).

Estos sesgos son especialmente frecuentes en los algoritmos de aprendizaje automático, ya que se entrenan sobre bases data heredadas, infiriendo el futuro a partir del pasado.

Las cuestiones esenciales relacionadas con la concepción y el desarrollo de un ciclo de vida de la IA digno de confianza se refieren tanto a cuestiones técnicas como éticas, como por ejemplo, ¿cómo detectar de forma fiable los posibles sesgos de una IA? ¿Cómo interpretar los resultados de un modelo? ¿Podemos medir la evolución del rendimiento de una IA? ¿Qué garantías de seguridad podemos ofrecer? ¿Podemos reaccionar ante una desviación? Esta lista no exhaustiva refleja la diversidad de los retos que hay que afrontar durante la producción de una IA.

Utilizar la IA para corregir sus sesgos

A medida que los modelos de IA han evolucionado de conceptos a productos, se han creado muchas soluciones técnicas para facilitar la automatización y el despliegue de los sistemas de IA. Recientemente, el número de soluciones técnicas disponibles se ha disparado, creando un rico ecosistema alimentado por la innovación constante tanto de las empresas de nueva creación como de los líderes del sector. Ejemplos notables son el Alianza para la Infraestructura de la IA y el Comunidad MLOps, de las que Artefact es miembro. Por tanto, encontrar la herramienta adecuada para cada tarea es cada vez más importante, y más difícil.

Al mismo tiempo, se ha desarrollado un ecosistema igualmente vibrante de empresas de consultoría para ayudar a sus clientes a tomar estas decisiones estratégicas.

Muchas de estas soluciones técnicas existen en código abierto y están a libre disposición de todos. Estos conjuntos de herramientas pueden detectar y medir los sesgos a lo largo de toda la cadena de procesamiento data: desde la recogida hasta la explotación, pasando por la transformación y el modelado. Estas soluciones deben aplicarse a lo largo de todo el ciclo de vida del producto, tanto en la fase de diseño y desarrollo como en la de producción, para garantizar una corrección permanente. Hay tres áreas concretas que pueden abordarse con soluciones técnicas.

“Los prejuicios no vienen de los científicos data, vienen de los datasets”.”

Corregir los sesgos del pasado en la IA

Los prejuicios no se originan en los científicos data, sino en los datasets. Por eso es necesario explorar y pensar en profundidad primero en los datasets. Los sesgos pueden ser tanto técnicos (variables omitidas, database o problemas de selección) como sociales (económicos, cognitivos, emocionales).

Para rectificar los conjuntos de entrenamiento, podría parecer lógico borrar todo rastro de data sensible. Sin embargo, esto sería tan inútil como peligroso: por un lado, porque el data no sensible puede estar insidiosamente correlacionado con el data sensible, y por otro, porque este tipo de atajo incita a limitar los controles regulares del data y de los procesos.

Para detectar estos sesgos, hay que ser consciente de que existen y saber qué buscar. Es importante comprender el contexto del data para interpretarlo correctamente. Un solo programa no puede identificar los sesgos, de ahí la importancia de contar con diversos equipos de científicos del data.

Es pensando de forma crítica sobre las diferentes métricas asociadas a un modelo de IA como podemos identificar y rectificar los problemas. Consideremos un modelo que necesita detectar una enfermedad presente en 1% de la población. Si el modelo predice siempre que la persona está sana, el modelo tendrá una tasa de precisión de 99%. Sin contexto, se trata de una puntuación excelente. Sin embargo, este modelo es inútil.

Utilizando estadísticas básicas, univariantes y bivariantes dataset puede identificar algunos sesgos. Por ejemplo, ¿está cada grupo de edad representado por igual? Una solución podría ser cambiar el data continuo por el categórico. Las matrices de correlación también pueden validar los vínculos entre dos variables relacionadas. Todo este trabajo previo es crucial para garantizar que los modelos se entrenan con conjuntos de data de calidad. En pocas palabras: “Basura dentro, basura fuera”.

Explicar los resultados de un modelo

Los sistemas de IA de alto rendimiento, como las redes neuronales artificiales, son muy eficaces y se utilizan en múltiples casos de uso. Sin embargo, son difíciles de interpretar, por lo que a menudo se les llama “modelos de caja negra”. El gran reto del aprendizaje automático es identificar y explicar la causa del sesgo en lugar de descartar sus consecuencias. Existe un compromiso entre la explicabilidad y la precisión. Algunos algoritmos como los árboles de decisión son muy explicables, pero menos útiles para predicciones más complejas.

El campo de la IA explicable (Ex-AI) intenta resolver este problema desarrollando métodos y algoritmos que aumenten la explicabilidad de los sistemas. Se puede explorar la comprensión global, que explica cómo funciona una IA en la población global, o la comprensión local, que explica cómo funciona el algoritmo en un ejemplo específico. Esta última es exigida por el GDPR porque para ser transparente, una IA debe ser capaz de explicar por qué el modelo tomó una determinada decisión para una persona/objeto/data línea en particular. Es importante tener en cuenta tanto la comprensión global como la local para entender cómo se comporta el modelo.

Para ello, los científicos data pueden fijarse en las variables significativas del modelo. Por ejemplo, no es normal que en un modelo de reclutamiento el sexo sea una variable importante. También pueden comprobar métricas como precisión (número de positivos bien predichos = positivo verdadero dividido por todos los positivos predichos = positivo verdadero + falso positivo), puntuación F1 (resume los valores de precisión y retirada en una sola métrica), o retirada (número de positivos bien predichos = verdadero positivo dividido por todos los positivos = verdadero positivo + falso negativo), en relación con una variable (por ejemplo, precisión para women frente a hombres).

“El gran reto del aprendizaje automático es identificar y explicar la causa del sesgo en lugar de descartar sus consecuencias”.”

Mejorar la solidez de un modelo

Las fuentes de fallos en los modelos de Inteligencia Artificial pueden ser accidentales, cuando el data está corrompido, o intencionadas, cuando son causadas por piratas informáticos, por ejemplo. Ambas fuentes de sesgo conducen a los modelos de Inteligencia Artificial al error al proporcionar predicciones o resultados incorrectos. Algunas soluciones permiten evaluar, defender y verificar los modelos y aplicaciones de aprendizaje automático frente a amenazas conflictivas que pueden tener como objetivo la data (envenenamiento de la data), el modelo (fuga de modelos) o la infraestructura subyacente, tanto de hardware como de software.

Fuente de la foto: https://arxiv.org/pdf/1412.6572.pdf

Simplemente superponiendo una imagen con ‘ruido’ a una imagen normal, se puede inducir a un clasificador a clasificar erróneamente un panda como un gibón. La diferencia es imperceptible para el ojo humano, pero esta técnica está bien documentada como capaz de inducir a error a los modelos de IA.

Desarrollar sistemas menos humanos, pero más humanistas

La noción de IA digna de confianza no puede reducirse a su concepción jurídica y técnica. Los aspectos humanos y organizativos son cruciales para el éxito de un enfoque ético de la IA. Las cartas éticas y las soluciones de mejora deben ser conocidas por todas las partes interesadas, aplicadas durante todo el proceso de creación y seguidas a lo largo del tiempo. Esto requiere una transformación de la cultura de la organización para integrar profundamente las cuestiones y los enfoques éticos, garantizar la sostenibilidad de las soluciones y contribuir a una IA ética. por diseño.

La IA en sí misma no es ni ética ni no ética. Es sólo la forma en que se entrena el sistema o cómo se utiliza lo que es ético o no. Por lo tanto, el verdadero riesgo ético vinculado al uso masivo de la IA no es que los algoritmos puedan rebelarse. Al contrario, el riesgo surge precisamente cuando la IA se comporta exactamente como le hemos pedido que lo haga, imitando nuestros prejuicios, repitiendo nuestros errores y reforzando nuestras incertidumbres e imprecisiones.

“El riesgo surge precisamente cuando la IA se comporta exactamente como le hemos pedido que lo haga”.”

Ser proactivo en la IA ética

Este tema nos interesa mucho en Artefact, Por eso le hemos dedicado equipos y hemos desarrollado un apoyo específico en el desarrollo de la gobernanza, la implementación de soluciones técnicas y la consultoría de estrategias de IA.

Trabajamos en estrecha colaboración con el mundo académico, como socio de la Bueno en tecnología cofundada por el Institut Mines-Télécom y Sciences Po, para reducir la brecha entre la investigación y la práctica. Artefact también ha recibido la etiqueta de IA Responsable y de Confianza, otorgada por la asociación independiente Laboratorios Labelia, lo que garantiza un alto nivel de madurez en el tema de la IA responsable y digna de confianza.

La cuestión de la ética nos concierne a todos, y es esencial ser proactivo en el tema; la adopción de un comportamiento ético no debe ser una mera reacción. La inteligencia artificial atraviesa un periodo evolutivo, en el que sus procesos y su ética están en vías de definición. En un campo que aún no está regulado, corresponde a quienes desempeñan un papel activo tomar la iniciativa. Como desarrolladores, consultores y gestores, es nuestra responsabilidad satisfacer las expectativas de todos los implicados -no sólo de los clientes y usuarios de los servicios, sino de la sociedad en general- y utilizar el poder de la IA para crear un mundo mejor.

Contáctenos

IA fiable: nuevos retos y soluciones data-driven