Reto: ampliar el marketing de precisión avanzado en más de 30 mercados
Sanofi es uno de los líderes mundiales de la industria farmacéutica. En los últimos 3 años, Artefact ha ayudado a la unidad de negocio CHC (Consumer Health Care) de Sanofi a comercializar sus medicamentos sin receta médica mediante tácticas y facilitadores "digital-first" para llegar a los consumidores adecuados en el momento oportuno con el mensaje adecuado, en más de 30 mercados.
Para su categoría de productos de temporada, Sanofi CHC ha desarrollado un enfoque basado en la previsión para ajustar el gasto en medios digitales según los picos de demanda previstos. A través de múltiples campañas piloto, el equipo de Transformación Digital Global pudo demostrar el valor añadido de este enfoque con un ROAS multiplicado por 2 a 4 según las geografías.
Sin embargo, la creación de una nueva campaña seguía consumiendo mucho tiempo: los científicos de data tenían que realizar una serie de tareas manuales, repetitivas y propensas a errores, lo que les impedía centrarse en otros proyectos innovadores. Con el fin de escalar sus innovadoras canalizaciones ML, el equipo científico de Sanofi data definió sus necesidades para industrializar el caso de uso y solicitó el apoyo de Artefact para diseñar e implementar conjuntamente una solución sólida.
Solución: un proceso de industrialización codiseñado basado en 6 soluciones clave
"La clave del éxito del proyecto fue la estrecha colaboración entre los expertos empresariales de Sanofi y los científicos de Sanofi data con el equipo de Artefact ."
- Albert Pla Planas, Data Jefe de equipo científico, Sanofi
A través de una estrecha colaboración entre Artefact y los equipos de data y de negocio de Sanofi, se diseñó un proceso de industrialización integral aprovechando la plataforma unificada Databricks. Nuestros objetivos conjuntos eran:
Simplifique la configuración de principio a fin de una nueva campaña estacional
Automatice las tareas de ingestión y procesamiento de data
Hacer la solución más robusta para evitar errores y el mantenimiento manual
Mejorar la capacidad de mantenimiento y la ampliación del proyecto
Tras una rápida auditoría de una semana para determinar el proceso actual y los puntos débiles técnicos, el equipo se alineó para implementar una infraestructura a prueba de futuro basada en 6 soluciones clave:
Separación de preocupaciones:
Disponer de un canal ETL independiente del proceso del modelo de previsión facilita su mantenimiento y ampliación. Esto nos permitió implantar comprobaciones automáticas junto con un sistema de supervisión que envía reports detallados a los equipos pertinentes sobre el estado de la ingestión.
Utilización del lago Delta como fuente de oro data :
En los equipos de DS en los que la infraestructura puede ser un engorro de obtener/mantener, Delta Lake combina las características clave de las soluciones de almacén data y lagos data , eliminando así la complejidad de la administración de bases de datos SQL. También cuenta con funciones de versionado -importantes para la reproducibilidad del ML- y servirá como única fuente de verdad para data.
Empaquetar todo el código posible en una biblioteca de Python para simplificar los procesos:
Parte del código inicial estaba disperso entre varios cuadernos dentro de Databricks, lo que complica la gestión de las dependencias y la reutilización del código. El desarrollo basado en cuadernos es relevante para la creación de prototipos, pero puede crear desafíos para la industrialización de proyectos de ML. El hecho de tener bibliotecas Python claramente definidas e implementadas en el cuaderno y mantener sólo Databricks como punto de entrada para Compute facilitó la generalización de los cuadernos y la organización de las campañas entrantes.
Aprovechamiento de Spark y Databricks:
El entrenamiento del modelo mediante métodos de búsqueda de hiperparámetros puede llevar mucho tiempo y ser exigente. Aquí es donde la infraestructura de autoescalado de Databricks y el tiempo de ejecución de ML gestionado con Spark e HyperOpt resultan útiles. El uso de cálculos en memoria de forma distribuida en un conjunto de trabajadores acelera el rendimiento y mejora considerablemente el tiempo de entrenamiento.
Uso del seguimiento del flujo ML:
Con el seguimiento del flujo de ML, Sanofi dispone ahora de una interfaz de usuario en la que los científicos de Data pueden comparar las ejecuciones del modelo y realizar un seguimiento de todos los parámetros utilizados (versión deData y parámetros del modelo) y los resultados obtenidos.
Simplificación de las pruebas y la aplicación de nuevos modelos de ML:
Se creó un marco genérico de fábrica de modelos, lo que facilitó la implementación de nuevos modelos de aprendizaje automático y la posibilidad de probarlos durante una campaña de marketing de precisión con muy poco esfuerzo.
Resultados y enseñanzas: un tiempo de preparación dividido por cuatro para la ingesta y configuración de data
Gracias a este proyecto, Sanofi CHC pudo simplificar en gran medida su canal de data y acelerar la ampliación de su caso de uso de marketing de precisión basado en previsiones.
Reducción del tiempo de preparación de nuevas campañas:
- El tiempo de preparación para la ingesta y configuración de data se ha reducido hasta en una cuarta parte.
- El número de tareas realizadas por los científicos de data para poner en marcha una nueva campaña se reduce hasta en un tercio.
Simplificación de la creación de nuevos modelos de previsión:
- Plataforma accesible para probar, gestionar y visualizar fácilmente los modelos.
- Proceso genérico para incluir nuevas fuentes data .
- Canalización automatizada data .
El proyecto también permitió a los equipos generar 4 aprendizajes importantes para futuros proyectos impulsados por el ML:
Integrar la ingeniería de data en los proyectos de ML:
Involucrar a los ingenieros de Data desde el principio de un proyecto para acelerar la industrialización de la canalización, y desacoplar claramente las diferentes etapas de la canalización (todo el manejo, transformación y curación de data debe ocurrir antes de saltar a las etapas de ML).
Aproveche las herramientas preconfeccionadas:
El uso de Databricks con Delta Lake y ML Flow fue crucial para el éxito de la industrialización, asegurando una infraestructura de fácil autoservicio sin necesidad de DevOps.
Profunda colaboración entre los equipos de Business y Data :
Posiblemente, el factor de éxito más importante fue la estrecha colaboración entre los expertos empresariales de Sanofi y los científicos de data , que idearon e impulsaron el proyecto, con el equipo de Artefact , que aportó experiencia y conocimientos adicionales en industrialización.
Utilizar metodologías ágiles para industrializar:
La metodología ágil (sprints, e iteraciones rápidas seguidas de semanas de retroalimentación y alineación) fue muy eficiente para identificar y abordar todos los puntos de dolor de Sanofi y asegurar la entrega de valor para los equipos de Sanofi.
Artefact desea agradecer a Ayaka Yanagisawa, Albert Pla Planas, Antoine Tran-Quan-Nam, Laurent Gautier y Sergio Villordo de Sanofi su confianza y colaboración en este proyecto, así como al equipo de Databricks por su apoyo reactivo. Este artículo ha sido coproducido por los equipos de Sanofi CHC y Databricks junto con Tristan Silhol, Maui Bar, Louise Morin y Eva Le Saux de las oficinas de Artefact en Estados Unidos y Francia.