Artefact 的管理合伙人法布里斯·亨利(Fabrice Henry)主持了此次讨论。与会者包括:谷歌欧洲、中东和非洲(EMEA)地区数据分析业务负责人约翰·皮卡德(Johan Picard);欧莱雅首席数据治理官让-诺埃尔·卢卡斯(Jean-Noel Lucas);Orange数据、人工智能与自动化副总监布里斯·米兰达(Brice Miranda);以及Univers Data总裁兼创始人让-克里斯托夫·布伦(Jean Christophe Brun)。
数据网格如何应对集中式数据架构的挑战,并助力运营人员更有效地利用数据?这Artefact“数据晨Artefact的核心议题。在此次活动中,多位在数据领域拥有丰富经验的顶尖高管齐聚一堂,就“什么是数据网格”、“企业如何实施数据网格”以及“数据网格未来的发展前景”等话题,分享了各自的见解和具体案例。
首先,让我们快速回顾一下数据网格(Data Mesh)的背景、内涵及意义:这一概念由 ThoughtWorks 的 Zhamak Dehghani 提出,旨在提升数据的可访问性,并简化集中式、单体化数据结构的组织方式。新冠疫情期间数据的爆发式增长进一步凸显了这些需求,如今,数据网格已从一个概念演变为一种分布式架构模型,旨在让组织内的每个人都能便捷地使用数据。
如何消除“数据仅供数据专家使用”这一瓶颈?
约翰·皮卡德 来自谷歌 提出了一些见解:“部分原因在于数据成熟度的提升。二十年来,企业一直在平台、数据湖和数据仓库上创建并集中管理数据。正是这一点使它们能够充分利用数据。但各个业务部门必须排队等待访问这些数据,从而导致积压和瓶颈。”
“有些人甚至不惜组建自己的‘影子IT部门’,因为IT团队虽然懂技术,却不了解数据质量;而业务部门则恰恰相反。但如今,随着cloud,技术正在不断演进,使得数据能够向业务部门下沉。需要记住的是,这是一种具有启发性的方法。每家公司的情况各不相同,必须根据自身背景、发展速度和目标,以适合自己的方式推进去中心化。”
在Orange, 布里斯·米兰达 亲身经历了这种数据集中与碎片化的现象。““我们原有的历史数据平台并非面向自助服务,因此许多团队都创建了自己的小型数据平台;最终我们拥有了40到60个这样的平台。”这家运营商利用Cloud (GoogleCloud )构建了一个平台,为各业务部门提供服务。“如今,我们正迈入‘数据民主’的新阶段”。
在今年年底创立自己的公司之前, 让-克里斯托夫·布伦 曾任家乐福首席技术官。“2015年,我们意识到必须转变对数据的认知,将零售业务的核心置于数据之上。直到2018年,我们一直在构建一个本地部署平台,以实现更强的数据驱动。2018年,我们成为谷歌合作伙伴,以进一步发挥算法的潜力。甚至在我们了解‘数据网格’这一概念之前,我们的目标就是拓展数据的商业应用场景。 我欣赏数据网格的一点在于,它让我们能够将 那些尚未标准化的事物,并为原则赋予明确的定义。”
让-诺埃尔·卢卡斯 在欧莱雅 三年前便启动了这一进程。时任首席执行官让-保罗·阿贡制定了发展方向:成为美妆科技领域的领军者。为此,我们需要统筹数据,打破职能壁垒;选定数据管理员,确立统一术语并构建数据结构,以建立全球参考体系。而这需要投入资源:“必须投入时间来确保数据可用。 我们评估了治理债务(约两到三年),并估算了围绕数据管理公司所需的资源。我们专门组建了一支100人的团队来准备数据。我们为集团引入了新的技能。我们还进行了大量反复的宣传工作,以保留支持这项工作的预算。因为欧莱雅人并不擅长抽象概念。我们必须将概念转化为具体术语”。
欧莱雅列举了50个利用产品数据的应用案例,涵盖从产品组合管理、到分销优化,再到库存管理等多个方面。“通过‘数据即产品’的战略,数据被分发到各个领域,其预处理工作则交由各品牌的专家负责,从而解决了瓶颈问题,”让-诺埃尔总结道。
如何在企业中实现大规模的数据民主化?
尽管Orange拥有用于咨询的数据工作室和用于搜索数据的Collibra,但这还远远不够:“当我们导入数据时,最终会出现重复数据,这带来了诸多问题。如果你查询客户的宽带设备,会得到800种不同的答案。”客户使用的是固网、移动网络还是光纤?工具无法分辨。客户是否已给予同意?我们也无从知晓。 没有单一的权威数据源或值得信赖的数据。因此,针对这些问题(“什么是Orange客户?”“什么是授权?”)正在进行概念验证(POC)。
Orange 略微领先于欧莱雅,后者有 40% 的数据存储在cloud。 “作为先决条件,数据必须既可获取又可发现,”让-诺埃尔表示。“我们必须在商业智能领域完成最后一步。随后,我们需要在数据价值链中向上拓展,将数据使用作为绩效指标(KPI),从而更贴近业务应用场景。这背后是数据文化方面的挑战,即让人们采用更标准化的解决方案,并看到真正的价值。”
“在家乐福,我们决定让数据产品负责人承担起责任,”让-克里斯托夫解释道,“他们了解数据的用途,并确保数据的有效传达:‘数据产品必须被使用。 数据产品负责人必须关注其产品的实际应用。过去,商业智能部门向各业务部门汇报工作。但现在,各业务部门在商业智能部门的支持下,已开始自主开展这项工作。家乐福接受过数据培训的人员中,有60%来自各业务部门。”
如何成功实现用例的工业化?
约翰·皮卡德解释说,这是一种分析与运营之间的双向互动过程:“数据必须先流向分析端,再回流到运营端。过去,数据库无法集成分析功能,因此我们创建了数据湖。在新范式下,我们更接近数据源,对数据的理解也更深入。因此,我们不再需要将运营与分析割裂开来。 我们的一些客户已将两者置于同一平台。SAP专家与数据专家并肩工作。布里斯·米兰达对此表示赞同,并补充道:“我们必须消除分析与运营之间旧有的界限,直达数据源头。”
让-诺埃尔·卢卡斯认为:“运营人员必须了解自己依赖哪些数据(通过思考业务流程),并努力提升数据质量。”例如,为了向门店供货并更好地管理库存,欧莱雅在PCM系统中新增了一层功能。 “我们希望让系统‘API化’。”欧莱雅在产品数据方面投入了大量精力,旨在为零售商和消费者提供360度全景视图。为了更好地管理供应链,欧莱雅需要对产品目录进行更精细的分类。而新的组织架构使得公司能够更灵活地应对市场变化,在需求增加时每周下达生产订单。
家乐福在将分析与运营相结合方面走得最远:在这个新格局下,分析已成为一种实时运营工具,其服务水平与运营部门并驾齐驱。“产品信息表必须记录所有数据,包括销售数据。这样,当某款产品缺货时,就能计算出不同产品之间的替代评分。这在三年前是难以想象的,”让-克里斯托夫总结道。

博客





