Artefact Research Center

Colmar la brecha entre el mundo académico y las aplicaciones industriales.

Investigación sobre modelos más transparentes y éticos para fomentar la adopción de AI business.

Ejemplos de sesgos AI

AppleCard concede hipotecas según criterios racistas
Lensa AI sexualiza los selfies de mujeres
Clasificación de imágenes racistas en Facebook con afroamericanos como monos
El chatbot de Twitter de Microsoft se vuelve nazi, sexista y agresivo
ChatGPT que escribe un código que afirma que los buenos científicos son hombres blancos

Desafío actual

AI son precisos y fáciles de implantar en muchos casos de uso, pero siguen siendo incontrolables debido a las cajas negras y las cuestiones éticas.

La misión de Artefact Research Center

Un ecosistema completo que tiende un puente entre
la investigación fundamental y las aplicaciones industriales tangibles.

Emmanuel MALHERBE

Jefe de Investigación

Campo de investigación: Aprendizaje profundo, aprendizaje automático

Emmanuel, que comenzó con un doctorado sobre modelos de PNL adaptados a la contratación electrónica, siempre ha buscado un equilibrio eficaz entre la investigación pura y las aplicaciones de impacto. Su experiencia investigadora incluye la previsión de series temporales de 5G para Huawei Technologies y modelos de visión por ordenador para clientes de peluquería y maquillaje en l'Oréal. Antes de incorporarse a Artefact, trabajó en Shanghái como responsable de investigación de AI para L'Oréal Asia. En la actualidad, su puesto en Artefact es una oportunidad perfecta y un entorno ideal para tender puentes entre el mundo académico y la industria, y fomentar su investigación en el mundo real al tiempo que repercute en las aplicaciones industriales.

Un ecosistema completo que tiende puentes entre la investigación fundamental y las aplicaciones tangibles de la industria.

Campos de investigación transversales

Con nuestro posicionamiento único, nuestro objetivo es abordar los retos generales de AI, ya sea en modelización estadística o en investigación de gestión.
Estas cuestiones son transversales a todos nuestros temas y nutren nuestra investigación.

Control y
rendición de cuentas

Modelos controlables con garantías de predicción
Interfaz con los planificadores de la demanda
Directores de categoría
Decisión según la mejor entrada del modelo: predicción fiable incluso fuera del conjunto de trenes
Ej: Aplicar la monotonía a las variables de entrada

Explicabilidad
y transparencia

Interpretación de las predicciones
Interfaz y visualización para usuarios no técnicos
Adaptar los módulos y componentes de los modelos a los métiers
Visualización de entradas comprensibles, antes de la ingeniería de funciones

Sesgo e
incertidumbre

Enriquecer la predicción para tomar mejores decisiones
Incertidumbre no simétrica (frente a la gaussiana) que necesitan los clientes
Adaptado a las series temporales y a la optimización del surtido

Obstáculos y aceleradores de AI en la empresa

Estudio de las organizaciones
Entrevistas con las 40 principales partes interesadas y responsables de la toma de decisiones del CAC
Impacto de AI ética, equidad, interpretabilidad
Gobernanza, normas y reglamentos para las aplicaciones AI

Temas

Trabajamos en varios temas de doctorado en la intersección de los casos de uso industrial y las limitaciones del estado de la técnica.
Para cada tema, trabajamos en colaboración con profesores universitarios y tenemos acceso a data industrial que nos permite abordar las principales áreas de investigación en un escenario real determinado.

1 - Previsión y fijación de precios

Modelizar las series temporales en su conjunto con un modelo de previsión multivariable y controlable. Esta modelización nos permitirá abordar la planificación de precios y promociones encontrando los parámetros óptimos que aumenten la previsión de ventas. Con este enfoque holístico, pretendemos captar la canibalización y la complementariedad entre productos. Nos permitirá controlar la previsión con garantías de que las predicciones se mantienen coherentes.

Mohamed CHTIBA

Investigador científico
sobre previsión y fijación de precios

Campo de investigación
-
Aprendizaje profundo, Optimización, Estadística

Jean-Marc BARDET

Profesor

Laboratorio SAMM

Página del becario

Campo de investigación
-
Procesos estocásticos, Estadística, Probabilidad

Joseph RYNKIEWICZ

Profesor asociado

Laboratorio SAMM

Página del becario

Campo de investigación
-
Series temporales, redes neuronales, estadística

2 - Puntuación explicable y controlable

Una familia muy utilizada de modelos de aprendizaje automático se basa en árboles de decisión: bosques aleatorios, boosting. Aunque su precisión suele ser la más avanzada, estos modelos tienen una sensación de "caja negra", lo que limita el control del usuario. Nuestro objetivo es aumentar su explicabilidad y transparencia, por ejemplo mejorando la estimación de los valores SHAP en el caso de conjuntos de datos desequilibrados. También pretendemos ofrecer algunas garantías para estos modelos, por ejemplo, para muestras fuera de entrenamiento o permitiendo mejores restricciones monotónicas.

Abdoulaye SAKHO

Investigador científico sobre
Modelos arbóreos

Campo de investigación
-
Estadística, explicable AI

Erwan SCORNET

Profesor

Laboratorio LPSM

Página del becario

Campo de investigación
-
Bosques aleatorios, Interpretabilidad, Valores perdidos

3 - Optimización del surtido

El surtido es un importante problema empresarial para los minoristas que se plantea a la hora de seleccionar el conjunto de productos que se venderán en las tiendas. Utilizando grandes conjuntos de datos industriales y redes neuronales, pretendemos construir modelos más sólidos e interpretables que capten mejor la elección del cliente cuando se enfrenta a un surtido de productos. El tratamiento de la canibalización y la complementariedad entre productos, así como una mejor comprensión de las agrupaciones de clientes, son claves para encontrar un conjunto más óptimo de productos en una tienda.

Vincent AURIAU

Investigador sobre optimización del surtido

Campo de investigación
-
Aprendizaje profundo,
Investigación operativa

Vincent MOUSSEAU

Profesor

Laboratorio MICS

Becario Página

Campo de investigación
-
Aprendizaje de preferencias, Análisis de decisiones multicriterio, Investigación operativa

Antoine DESIR

Profesor asociado

Laboratorio TOM

Página del becario

Campo de investigación
-
Modelización de la elección, optimización del surtido, investigación operativa

Ali AOUAD

Profesor Asistente

Ciencias de la gestión y operaciones

Página DBLP

Campo de investigación
-
Emparejamiento dinámico, modelización de la elección, optimización del surtido y del inventario, algoritmo de aproximación, investigación operativa

4 - AI Adopción en las empresas

El reto de una mejor adopción de AI en las empresas consiste, por un lado, en mejorar los modelos AI y, por otro, en comprender los aspectos humanos y organizativos. En la encrucijada de la investigación cualitativa sobre gestión y la investigación social, este eje pretende explorar dónde encuentran dificultades las empresas a la hora de adoptar las herramientas de AI . Los marcos existentes sobre la adopción de innovaciones no son del todo adecuados para las innovaciones del aprendizaje automático, ya que existen diferencias típicas con la normativa, la formación de las personas o los prejuicios cuando se trata de AI, y más aún con AI generativo.

Lara ABDEL HALIM

Investigador científico sobre la adopción de AI en las empresas

Campo de investigación
-
Investigación en gestión, Innovación

Cécile CHAMARET

Profesor

Laboratorio CRG

Página del becario

Campo de investigación
-
Innovación, marketing, investigación social cualitativa

5 - Sostenibilidad Data

El proyecto movilizará métodos de investigación cualitativos y cuantitativos y abordará dos cuestiones clave: ¿Cómo pueden medir eficazmente las empresas sus resultados en materia de sostenibilidad social y medioambiental? ¿Por qué las medidas de sostenibilidad no suelen producir cambios significativos en las prácticas organizativas?

Por un lado, el proyecto pretende explorar métricas data e identificar indicadores para alinear los procedimientos organizativos con los objetivos de sostenibilidad social y medioambiental. Por otro, el proyecto se centrará en transformar estas medidas de sostenibilidad en acciones concretas dentro de las empresas.

Oualid Mokhantar

Investigador científico sobre sostenibilidad

Campo de investigación
-
Investigación de gestión, Economía

Gorgi KRLEV

Profesor asociado

Departamento de Sostenibilidad

Página del becario

Campo de investigación
-
Sostenibilidad, Innovación social, Teoría de las organizaciones

6 - Sesgo en la visión por ordenador

Cuando un modelo realiza una predicción basándose en una imagen, por ejemplo de un rostro, tiene acceso a información sensible, como la etnia, el sexo o la edad, que puede sesgar su razonamiento. Nuestro objetivo es desarrollar un marco para medir matemáticamente ese sesgo y proponer metodologías para reducirlo durante el entrenamiento del modelo. Además, nuestro enfoque detectaría estadísticamente las zonas de fuerte sesgo para explicar y comprender y controlar dónde tales modelos refuerzan el sesgo presente en la data.

Veronika SHILOVA

Investigador científico sobre sesgos en visión por ordenador

Campo de investigación
-
Aprendizaje profundo, visión por ordenador, sesgos

Laurent RISSER

Ingeniero de investigación del CNRS

Instituto de Matemáticas de Toulouse

Página del becario

Campo de investigación
-
Aprendizaje automático explicable, análisis de imágenes, interpretable y robusto AI

Jean-Michel LOUBES

Profesor

Instituto de Matemáticas de Toulouse

Página del becario

Campo de investigación
-
Aprendizaje insesgado, Interpretable AI, Transporte óptimo y aplicaciones a la estadística, Aprendizaje automático

7 - LLM para la recuperación de información

Una de las principales aplicaciones de los LLM es cuando se combinan con un corpus de documentos que representan algún tipo de conocimiento o información industrial. En tal caso, hay un paso de recuperación de información, para el que los LLM muestran algunas limitaciones, como el tamaño del texto de entrada, que es demasiado pequeño para indexar documentos. Del mismo modo, el efecto de alucinación también puede producirse en la respuesta final, que pretendemos detectar utilizando el documento recuperado y la incertidumbre del modelo en el momento de la inferencia.

Hippolyte GISSEROT-BOUKHLEF

Investigador científico sobre modelos lingüísticos de gran tamaño para la recuperación de información

Campo de investigación
-
Aprendizaje profundo, PNL

Pierre COLOMBO

Profesor asociado

Laboratorio MICS

Página del becario

Campo de investigación
-
Grandes modelos lingüísticos, sesgo en AI, Evaluación de modelos

Céline HUDELOT

Profesor

Laboratorio MICS

Página del becario

Campo de investigación
-
Representación del conocimiento, interpretación semántica, redes neuronales

Artefactinvestigadores a tiempo parcial

Además de nuestro equipo dedicado a la investigación, contamos con varios colaboradores que dedican parte de su tiempo a la investigación científica y a la publicación de artículos. Al trabajar también como consultores, se inspiran en los problemas del mundo real con los que se encuentran nuestros clientes.

Michael Voelske

Ámbito de investigación

Aplicaciones de los grandes modelos lingüísticos a la recuperación de información y la PNL

Modelos explicables en aprendizaje automático, recuperación y clasificación

IR para necesidades de información complejas y basadas en tareas

Desde mayo de 2022, dirijo el equipo de ciencia e ingeniería de Data en Artefact Alemania, donde aplico mi formación académica en informática, con un doctorado centrado en el aprendizaje automático y la recuperación de información, a la resolución de los problemas empresariales de los clientes de Artefact. Mi papel consiste no sólo en liderar, sino también en inspirar a mi equipo para combinar la investigación puntera de AI con aplicaciones pragmáticas. Apasionado por hacer accesibles los complejos conceptos de AI , me esfuerzo por aprovechar la tecnología tanto para soluciones empresariales innovadoras como para lograr un impacto social significativo.
Evan Hurwitz

Ámbito de investigación

Aprendizaje por refuerzo

Aprendizaje automático

Finanzas y juego

Evan es Doctor Ingeniero en Inteligencia Artificial , donde aplicó técnicas de AI a la optimización de una cartera gestionada activamente mediante múltiples estrategias de negociación. Ha realizado trabajos de investigación en el mundo académico, donde es coautor de "Inteligencia Artificial and Economic Theory: Skynet in the Market". Más tarde pasó a trabajar en soluciones de energía verde utilizando el aprendizaje por refuerzo para S&P Platts, tras lo cual trabajó con Preqin en la ingesta y comprensión de la inversión alternativa data. Se incorporó a Artefact en 2020 y ha trabajado en múltiples sectores, como el comercio minorista, la ciberseguridad, SaaS, la ingeniería, la educación y el sector inmobiliario, con clientes que van desde pymes hasta empresas del FTSE100.
George Cevora

Ámbito de investigación

Neurociencia

Aprendizaje profundo

Aprendizaje automático

George se doctoró en Neurociencia Teórica por la Universidad de Cambridge por su trabajo sobre la modelización matemática del aprendizaje animal. George cuenta con 10 años de experiencia investigadora en aprendizaje profundo, que ahora aplica en entornos industriales. Desde que dejó el mundo académico, George ha trabajado en una amplia gama de industrias y dominios de problemas, desde motores a reacción hasta resistencia a los antibióticos. George también ha pasado unos años en el ámbito de la seguridad nacional, creando un producto para combatir la discriminación derivada del uso inadecuado de AI. Más información en www.cevora.xyz.
Savio Rozario

Ámbito de investigación

Aprendizaje automático

Optimización no lineal

Física

Savio es doctor en física experimental del plasma láser por el Imperial College de Londres, donde utilizó métodos de aprendizaje automático para optimizar la configuración experimental de sistemas aceleradores de plasma altamente no lineales. Trabajó en EY en su departamento de I+D fiscal, desarrollando soluciones de aprendizaje automático para la supervisión del cumplimiento en múltiples geografías utilizando grandes modelos lingüísticos. Se incorporó a Artefact en 2022 y ha desarrollado soluciones científicas integrales en data en diversos sectores, como el comercio minorista, el transporte y el sector inmobiliario, para empresas del FTSE250.
Nelson Paz

Nelson pasó la primera década de su carrera en una combinación de mercados de renta variable y materias primas, donde desplegó estrategias de negociación cuantitativa en mercados OTC. Tras finalizar su máster en Data Science en 2021, se incorporó a la oficina británica de Artefactcomo científico de data , donde trabaja en problemas científicos de data en diversos ámbitos, con experiencia en aplicaciones de AI en mercados financieros y negociación.

Publicaciones

- Khalid Al Khatib, Michael Voelske, Anh Le, Shahbaz Syed, Martin Potthast y Benno Stein".Un nuevo conjunto de datos para la identificación de la causalidad en textos argumentativos", en Proceedings of the 24th Meeting of the Special Interest Group on Discourse and Dialogue (SIGDIAL), ACL (2023).
- Glen Hopkins y Kristjan Kalm. "Clasificación de documentos complejos: Comparación de soluciones a medida con grandes modelos lingüísticos"arXiv preprint arXiv:2312.07182 (2023)
- Olivier Turnbull y George Cevora. "La inestabilidad de los modelos de visión por ordenador es un resultado necesario de la propia tarea" arXiv preprint arXiv:2310.17559 (2023).
- Marcel Marais, Máté Hartstein y George Čevora, "Using linear initialisation to improve speed of convergence and fully-trained error in Autoencoders"arXiv preprint arXiv:2311.10699 (2023).
- Evan Hurwitz, Nelson Peace y George Cevora. "Achieving Stable Training of Reinforcement Learning Agents in Bimodal Environments through Batch Learning."arXiv preprint arXiv:2307.00923 (2023).
- Savio Rozario y George Čevora. "Explainable AI does not provide the explanations end-users are asking for".arXiv preprint arXiv:2302.11577 (2023).
- Vincent Auriau, Emmanuel Malherbe y Matthieu Perrot. "Weak Segmentation-Guided GAN for Realistic Color Edition." En International Conference on Image Analysis and Processing, Springer Nature Switzerland, (2023).
- Maté Hartstein y George Čevora. "MétodoData para navegar por el Atlántico en una regata de remo".
- Evan Hurwitz y George Čevora. "Previsión del rendimiento de los programas de recualificación de la mano de obra."arXiv preprint arXiv:2107.10001 (2021).

Artículos del blog Medium escritos por nuestros expertos en tecnología.

Optimización del surtido con modelos de elección discreta en Python

La optimización del surtido es un proceso crítico en el comercio minorista que consiste en seleccionar la combinación ideal de productos para satisfacer la demanda de los consumidores teniendo en cuenta...

¿Es siempre la alineación de preferencias la mejor opción para mejorar la traducción basada en LLM? Un análisis empírico

Las métricas neuronales para la evaluación de la traducción automática (TA) son cada vez más importantes debido a su mayor correlación con los juicios humanos en comparación con las métricas léxicas tradicionales.

Choice-Learn: Modelización de elecciones a gran escala para contextos operativos a través de la lente del aprendizaje automático.

Los modelos de elección discreta tienen como objetivo predecir las decisiones de elección tomadas por los individuos a partir de un menú de alternativas, denominado surtido. Los casos de uso más conocidos incluyen la predicción de una...

La era generativa AI: ¿Qué está cambiando?

La abundancia y diversidad de respuestas a ChatGPT y otras IA generativas, ya sean escépticas o entusiastas, demuestran los cambios que están provocando y el impacto...

Cómo Artefact consiguió desarrollar un sistema de carrera justo y sencillo para los ingenieros de software.

En el dinámico sector tecnológico actual, en constante evolución, una carrera profesional puede parecer a menudo un camino sinuoso a través de un denso bosque de oportunidades. Con...

Por qué necesita LLMOps

Este artículo presenta LLMOps, una rama especializada que fusiona DevOps y MLOps para gestionar los retos que plantean los grandes modelos lingüísticos (LLM)...

Liberar la potencia del lenguaje de expresión LangChain (LCEL): de la prueba de concepto a la producción

LangChain se ha convertido en menos de un año en una de las bibliotecas de Python más utilizadas para interactuar con LLM, pero LangChain era sobre todo una biblioteca...

Cómo gestionamos la conciliación de ID de perfil utilizando Treasure Data Unification y SQL

En este artículo explicamos los retos de la conciliación de ID y demostramos nuestro enfoque para crear un ID de perfil unificado en la plataforma de clientes Data , en concreto...

Snowflake's Snowday '23: Snowballing into Data Science Success

Al reflexionar sobre las ideas compartidas durante el "Snowday" del 1 y 2 de noviembre, una cascada de interesantes revelaciones sobre el futuro de...

Cómo entrevistamos y contratamos ingenieros de software en Artefact

Repasamos las competencias que buscamos, las distintas fases del proceso y los compromisos que asumimos con todos los candidatos.

Codificación de características categóricas en la previsión: ¿lo hacemos todos mal?

Proponemos un método novedoso para codificar características categóricas específicamente adaptadas a las aplicaciones de previsión.

Cómo desplegamos un sencillo sistema de vigilancia de la fauna salvaje en Google Cloud

Colaboramos con Smart Parks, una empresa holandesa que ofrece soluciones avanzadas de sensores para conservar la fauna salvaje en peligro...

Artefact Research Center

Colmar la brecha entre el mundo académico y las aplicaciones industriales.

Investigación sobre modelos más transparentes y éticos para fomentar la adopción de AI business.

Ejemplos de sesgos AI

Desafío actual

La misión de Artefact Research Center

Un ecosistema completo que tiende puentes entre la investigación fundamental y las aplicaciones tangibles de la industria.

Campos de investigación transversales

Control y rendición de cuentas

Explicabilidad y transparencia

Sesgo e incertidumbre

Obstáculos y aceleradores de AI en la empresa

Temas

1 - Previsión y fijación de precios

2 - Puntuación explicable y controlable

3 - Optimización del surtido

4 - AI Adopción en las empresas

5 - Sostenibilidad Data

6 - Sesgo en la visión por ordenador

7 - LLM para la recuperación de información

Artefactinvestigadores a tiempo parcial

Publicaciones

Artículos del blog Medium escritos por nuestros expertos en tecnología.

Control y
rendición de cuentas

Explicabilidad
y transparencia

Sesgo e
incertidumbre