挑战:在 30 多个市场推广先进的精准营销

赛诺菲是世界制药业的领导者之一。在过去 3 年中, Artefact 已帮助 赛诺菲 CHC(消费者保健)业务部门通过以下方式销售其非处方药物 在 30 多个市场采取数字优先策略和辅助手段,在正确的时间向正确的消费者传达正确的信息.

针对其季节性产品类别,赛诺菲 CHC 开发了一种基于预测的方法,根据预测的需求高峰调整数字媒体支出。. 通过多个试点活动,全球数字转型团队得以证明这种方法的附加值,其中包括 ROAS 根据地域乘以 2 至 4.

然而, 建立新活动仍然耗时:data 科学家不得不完成一系列手动、重复且容易出错的任务,这使他们无法专注于其他创新项目。为了扩展其创新的 ML 流水线,赛诺菲 data 科学团队确定了他们的需求,以实现用例的工业化,并呼吁 Artefact 提供支持,共同设计和实施一个强大的解决方案。.

解决方案:基于 6 个关键解决方案的共同设计的工业化流程

该项目的成功关键在于赛诺菲业务专家和赛诺菲 data 科学家与 Artefact 团队之间的密切合作。.

- Albert Pla Planas,赛诺菲 Data 科学团队负责人

通过 Artefact 和赛诺菲的 data 以及业务团队之间的密切合作,一个全面的工业化流程利用统一的 Databricks 设计了一个平台。我们的共同目标是

  • 简化新季节性活动的端到端设置

  • 自动执行 data 采集和处理任务

  • 使解决方案更加强大,以防止错误和人工维护

  • 提高项目的可维护性和可扩展性

经过为期一周的快速审核,确定了当前的流程和技术痛点,团队在 6 个关键解决方案的基础上实施了面向未来的基础设施:

  • 将关注点分开:

    将 ETL 流水线与预测模型流程分开,使其更易于维护和扩展。这样,我们就可以在监控系统旁实施自动检查,向相关团队发送有关摄取状态的详细 reports 信息。.

  • 使用 三角洲湖 作为 data 黄金源:

    在 DS 团队中,获取/维护基础架构可能是一件麻烦事,Delta Lake 结合了 data 仓库和 data 湖解决方案的主要功能,从而消除了 SQL database 管理的复杂性。它还具有版本功能--这对 ML 的可重复性非常重要--并将成为 data 的唯一真实来源。.

  • 将尽可能多的代码打包到 Python 库中,以简化流程:

    部分初始代码分散在 Databricks 中的多个笔记本中,使得依赖关系管理和代码重用性变得更加复杂。基于笔记本的开发适用于原型开发,但会给 ML 项目的产业化带来挑战。在笔记本上实施定义明确的 Python 库,并仅将 Databricks 作为 Compute 的入口点,这使得笔记本的通用化和组织传入活动变得更加容易。.

  • 利用 Spark 和 Databricks:

    使用超参数搜索方法训练模型既费时又费力。这时,Databricks 的自动扩展基础架构以及带有 Spark 和 HyperOpt 的托管 ML 运行时就派上用场了。以分布式方式在一组工作者身上使用内存计算可加快性能并大大缩短训练时间。.

  • 使用 ML 流量跟踪:

    ML 流量跟踪 现在,赛诺菲有了一个用户界面,Data 科学家可以在该界面上比较模型运行情况,并跟踪所有使用的参数(Data 版本和模型参数)和获得的结果。.

  • 简化新 ML 模型的测试和实施:

    我们建立了一个通用模型工厂框架,从而可以更轻松地实施新的机器学习模型,并在精准营销活动中以极小的工作量试用这些模型。.

结果和经验:data 输入和配置的设置时间除以 4

得益于该项目,赛诺菲 CHC 得以大大简化其 data 流水线,并加速扩展其基于预测的精准营销用例。.

  • 减少新活动的设置时间:

    • data 接收和配置的设置时间最多可缩短四分之一。.
    • data 科学家开展新活动的任务数量最多可减少三分之一。.
  • 简化新预测模型的创建过程:

    • 可访问的平台,轻松测试、管理和可视化模型。.
    • 包括新 data 源的通用流程。.
    • 自动 data 管道。.

Sanofi Client Case - Key Achievements

该项目还让团队为未来的 ML 驱动型项目积累了 4 项重要经验:

  • 将 data 工程纳入 ML 项目:

    从项目一开始就让 Data Engineer 参与进来,以加快管道的工业化进程,并将管道的不同阶段明确分离(所有 data 的处理、转换和整理都必须在进入 ML 阶段之前进行)。.

  • 利用预包装工具:

    Databricks 与 Delta Lake 和 ML Flow 的配合使用对工业化的成功至关重要,可确保无需 DevOps 即可轻松实现自助服务基础设施。.

  • 业务团队和 Data 团队之间的深入合作:

    最重要的成功因素可能是赛诺菲业务专家和 data 科学家与 Artefact 团队之间的密切合作,赛诺菲业务专家和 data 科学家是项目的构思者和推动者,而 Artefact 团队则带来了更多的产业化经验和技术诀窍。.

  • 利用敏捷方法实现产业化:

    敏捷方法论(冲刺和快速迭代,然后是反馈和调整周)非常有效地识别和解决了赛诺菲的所有痛点,并确保为赛诺菲团队带来价值。.


Artefact感谢赛诺菲公司的Ayaka Yanagisawa、Albert Pla Planas、Antoine Tran-Quan-Nam、Laurent Gautier和Sergio Villordo对本项目的信任与合作,以及Databricks团队的积极支持。本文由赛诺菲 CHC 和 Databricks 团队与 Artefact 美国和法国办事处的 Tristan Silhol、Maui Bar、Louise Morin 和 Eva Le Saux 共同制作。.