关于 data governance 的理论文章很多。在 Artefact,我们希望通过我们的 “现场见解 ”系列文章,从操作的角度来探讨这个话题,为我们的读者提供务实和可操作的见解。该系列文章将包括我们对 data governance 关键主题(如运营模式)的观察和反馈、对客户和潜在客户常问问题的回答(如如何衡量 data governance 的影响),以及对 data governance 关键参与者(如首席 Data 官、首席治理官、data 监护人、软件编辑等)的采访。.
注
第 1 阶段--无意识的无能:缺乏 data governance 的 “症状 ”是什么?
- 公司面临 未解决的业务问题 由于 data governance
- 该公司 无路可走 由需要成熟 data 的现有计划(战略用例、IT 迁移等)
- 处理这些症状有助于 意识到挑战和重要价值 的 data governance
第 2 阶段--自觉无能:企业在开始 data governance 之旅时会遇到哪些挑战?
- 证明 data governance 属于 价值data:未加工的 data 是尚未开发的潜力,而精加工的 data 则是黄金
- 寻找合适的 财务模型 启动首批计划:由使用案例驱动还是由中央转型机构驱动
- 动员人民 交付:在 data governance 联合团队内部和外部交付
第 3 阶段--自觉能力:企业在启动 data governance 计划时通常会采取哪些步骤?
- 第一步--构建 data governance 资产领域、运作模式、路线图、工具
- 第二步 - 在每个 data 域内部署 data governance:data 质量、标准化和便利性。要么在有限的时间内通过大型计划进行全面翻新;要么在较长的时间内分散施工,从最关键的部分开始,逐步完成其他部分
第 4 阶段--无意识能力:当 data governance 成为新常态时会发生什么?
- Data 治理不再是一场旅行,而是一场 绝技
- Data 治理是 人人有责:COMEX 成员、业务所有者、工程主管、领域开发团队、Data 管理员、用例和功能团队

了解什么是 data governance、为什么它是实现价值的关键途径以及如何在企业中具体部署它,是一条漫长的道路。当企业首次推出具有人工智能和 data 用例的大型转型计划时,他们很快就意识到这些计划需要 data platforms、data 湖、data 质量管理和 MDM 等关键推动因素,从而使质量 data 暴露于用例。直到最近,data governance 才成为与所创建的无数复杂系统有关的优先事项。.
如今,CDO/CTO 生态系统中的几乎每个人都明白,data governance 是人工智能转型的先决条件。他们熟悉所有基本的组织和运营概念,但要将其运用到音乐中以实现具体价值,则是一项复杂得多的任务。因此,data governance 往往沦为影响甚微的孤立文件计划。在我们的客户组织中,我们看到许多计划正在启动,也出现了许多 data governance 的负责人。起初,他们在说服赞助商和业务合作伙伴投资这些活动时都遇到了同样的困难。为什么呢?因为部署 data governance 是企业必须经历的一个完整的学习过程,而这一过程中的每一步都很重要。.
本文旨在通过带领大家了解每个公司都不可避免要经历的 data governance 学习过程,帮助大家理解什么是 data governance 实践。.
第一阶段--无意识的无能:缺乏 data governance 的 “症状 ”是什么?
甚至在开始旅程之前,第一个挑战就是确定 data governance 问题。在这一阶段,公司尚未意识到许多业务问题与 data governance 活动直接相关。旅程的第一步是确定组织中哪些基本问题无人能够回答。.

这类问题将 data governance 与它所能产生的潜在商业价值直接联系起来,避免了以 IT 或隐私为导向的方法将 data governance 简化为主 Data 或访问权管理的陷阱。.
在现场,我们还观察到引发 data governance 计划启动的其他典型情况:
要在 data governance 学习道路上前进,企业需要面对尚未解决的业务问题,否则就会被逼入绝境。只有这样,他们才能意识到所面临的挑战,并理解 data governance 的重要价值。.
第二阶段--自觉无能:在开始 data governance 之旅时,企业会遇到哪些挑战?
一旦公司决定正式开始 data governance 之旅,就会面临三大挑战:(1) 证明 data governance 的价值,(2) 找到合适的财务模式来启动首批计划,以及 (3) 动员员工交付成果。.
1.证明 data governance 的价值:未加工的 data 是未开发的潜力,而精加工的 data 是黄金
首要挑战之一是说服董事会。Data 治理的倡导者需要找到合适的理由来证明,应该投资 data governance,并在 data 转型路线图上留出空间,有时甚至不惜牺牲用例。.
[来自现场 #1] 在首席执行官和首席财务官的赞助下,CPG 行业的 data governance 领导者为有抱负的 data 所有者(excom n-1)组织了一次训练营。他们介绍了公司需要解决的 data governance 债务,以便更快地实现 data 转型收益(即各部门尚未解决的业务问题,以及由于 data 质量或可访问性差而难以交付战略性 COMEX 用例)。.
[来自现场 #2] 为了说服管理层,一家电信运营商的 data governance 领导人开发了一个包含三种收入来源的商业案例:
> 收入缺失(例如,由于订购系统中的地址缺失或质量不佳,导致收入减少)
> 节余(例如,为不再使用的技术或商业网站支付的租金或订阅费用)
> data 小组的业务效率收益(例如,估计在 data 质量问题上节省的全职等值人员数量)。.
2.找到合适的财务模式:由使用案例驱动还是由中央转型机构驱动
外地经常提出两个问题:启动 data governance 计划需要多少费用?由谁来支付?可以分为两种模式:
模式 1 是转型后的目标,即通过设计将 data governance 嵌入所有项目。在转型前和转型期间,模式 2 通常适用于建立最佳实践。.
[来自现场 #3] 一家大型 CPG 企业的首席财务官深信 data governance 对企业的价值,在他的授权下成立了 data governance 中央办公室,并为其提供了中央预算。估计预算约为 1 500 万欧元。另一家企业则选择了分两步走的战略:在转型的最初几年,他们每年为 data governance 办公室手中的 data governance 编列 200 万欧元的预算,但他们计划逐步使公司适应环境,并转向模式 1。.
3.动员人们交付成果:在 data governance 联合团队内部和外部
围绕 data governance 问题动员公司员工是一项关键挑战。.
在 data governance 团队内部,成功的关键因素是实施联合交付模式,即由各业务领域团队分散和推动业务。中央办公室或领导(视规模而定)负责构建计划、实施工具箱和定义标准。其首要任务是将公司的 data 划分为 data 领域,并为每个领域指定一名负责人,由其负责指定各自领域的关键角色(监管人、保管人......)。.
除 data governance 小组外,中央办事处还必须对小组进行文化适应和技能培训,以配合与 data 互动的新的、更有条理的方式。.
[来自现场 #4]
> 在 C 级:一家主要的 CPG 企业与 COMEX 组织了几次会议,以提高其成员对 data governance 问题的认识。.
> 在使用案例层面:另一家 CPG 企业培训其所有产品负责人和 Data 科学家,在人工智能和 data 使用案例中通过设计部署 data governance(开发 data 质量检查、Collibra 中的 data 系列等)。.
>> 在领域层面:一家电信公司对 data 管理员和所有者入职进行正式培训(如何操作、工具等)。.
> 在公司层面:一家公司面向所有人开展宣传活动,传播其 data 卓越文化。.
一旦克服了这些最初的挑战,就可以认为组织有足够的能力和成熟度来确定最佳的启动方法,并在没有太多前期投资的情况下取得第一批实际成果。.
第三阶段--自觉能力:启动 data governance 计划应遵循哪些步骤?

1.Step 1 - 构建 data governance 资产:领域、运营模式、路线图、工具
data governance 办事处的首要关键活动之一是将 data 资产结构化为 data 域。这项活动使公司能够
一旦完成这项工作,下一步就是为每个领域指定负责人(他们将确定活动的优先次序和目标)和监管人(他们将在业务上部署质量和文档例程)。我们注意到,成功的 data governance 模式都是 “联合 ”模式,业务活动分散在各个领域,而 data governance 的负责人则在 data 的中央团队中,负责推动、协调活动,并赋予管理者和所有者权力。.
成熟的企业以业务为导向,并将其 data governance 路线图与其 data 用例路线图紧密联系起来。他们将 data 领域与公司的战略用例进行映射,并优先考虑服务于众多用例的领域。成功的关键因素之一是从小处入手,避免隧道效应,确定两三个关键领域,并配备积极主动的所有者和管理者,在其他领域部署之前完善方法。.
工具对于长期保持 data governance 至关重要,但 data governance 首先是一个组织问题。如果企业不相信 data governance 的重要性,如果运营模式不到位,那么这些工具就不会被采用,对企业来说就是在浪费资源和时间。.
[来自现场 #5] 例如,一家大型 CAC 40 公司的 IT 部门与 Collibra 签订了合同,但没有考虑到持续部署这一举措所需的运营模式。他们采用了一种信息技术驱动的方法,筛选所有 data 数据库,记录表 data 方案。Data 管理员没有在表格方案的基础上添加业务层。使用该工具的 IT 人员寥寥无几,投资回报率也没有体现出来。两年后,data团队决定与Collibra一起重新启动以业务为导向的计划,这次是根据他们希望提供的战略用例确定路线图的优先次序,并围绕该工具创建一个Collibra社区,以提高使用率。该工具已经从一个简单的文档工具转变为一个data智能工具,嵌入到data的关键流程中,现在被data科学家广泛用于data发现。.
2.Step 2 - 在 data 各领域内部署 data governance:data 质量、标准化和可访问性
方法 1 - 在有限的时间内完成翻新工程,实施重大计划
启动了重大转型计划并在成功交付 data 和人工智能案例方面面临重大问题的大公司通常会选择方法 1。目前正在向 cloud 转型的公司也会选择这种方法,因为这关系到其 data 资产在新的 data platform 中的结构。这种整体或端到端方法旨在通过 data governance 的四个维度:质量、标准化、可访问性和所有权,从地板到天花板清理 data 领域。.
[来自现场 #6]为了解释这种方法,让我们以一家启动了重大 data 转型计划的 CPG 公司为例。该公司利用向 cloud 迁移的机会清理其 data,并将其 data 资产重组为 18 个 data 域,便于终端用户发现和访问,目的是提供高价值的人工智能用例。在成立 data governance 办公室协调该计划后,他们部署了一套全面的方法来评估 data 的成熟度,定义 data 领域分类标准,并在谷歌云平台上开发新的 data 模型,以便在许多用例中重复使用。.
如此重大的 data 转型计划的一个关键方面是能够协调 18 个 data 领域的工作。data governance 办公室在确保 data 领域之间的一致性和确定总体优先事项方面发挥着至关重要的作用。.
方法 2 - 将工作分摊到一个较长的时期内,从最关键的部分开始,然后逐步完成其他部分
方法二更适合需要在启动重大计划之前证明 data governance 价值的公司。起初,这些公司将重点放在他们希望通过 data governance 解决的一个具体痛点上。有时,这些计划甚至没有标明是 “data governance”。.
[来自实地的 #7]务实的 data governance 举措的一些实例:
“来源驱动”的方法:一家制药公司启动了客户关系管理 data 统一计划,以解决其销售代表在各分支机构采集的 data 质量有限且不统一的问题。这一举措是由中央营销团队的抱怨引发的,因为他们无法在子公司之间进行比较,也无法了解整体业绩(例如:在 Veeva 中指定心脏病专家的六种不同方式)。.
“仪表盘驱动 ”方法:一家公用事业公司利用 Collibra 目录解释其 COMEX 仪表盘的关键绩效指标是如何计算的,并使整个组织了解如何计算这些战略性关键绩效指标。.
“访问管理”方法:在转向 cloud 的过程中,我们的一个客户重新启动了两年前失败的 data governance 计划,在其新的 cloud 平台中定义了 data 的无障碍水平。.
“用例驱动”方法:一家主要的 CPG 企业决定将其销售一空的 data 标准化,以满足非常关键的需求规划用例的需求。他们确定了实现用例所需的 data 对象,选择并鉴定了 data 来源,并将其 data 标准化,以建立一个单一的 data 模型,用于开发任何需要该 data 的用例。.
“质量驱动”方法:我们的一个客户实施了质量评估和补救流程,以确定关键的 data 质量痛点,在 data 质量委员会中对其进行优先排序,并与技术团队一起跟踪问题的解决情况。.

第 4 阶段--无意识能力:当 data governance 成为新常态时会发生什么?
在我们开始之前,有必要强调的是,除了纯粹的参与者或围绕 data 设计的最新公司之外,达到最后阶段(data governance 已成为自动化)的公司相对较少。.
1.Data 治理不再是一种旅程,而是一种成就技能
Data 治理不再被视为需要利益相关者付出巨大努力的耗时转型之旅。现在,它已成为完全融入公司流程的一项技能,每个从事 data 工作的人都会受到它的影响。.
2.Data 治理是每个人的责任
COMEX 成员 促进 data 在公司内部的流通。他们依靠 data 的统一视图(单一真实来源)来做出所有战略决策和监控公司业绩。.
企业主 认识到 data governance 是其业务转型成功的关键因素。每项业务举措都 “设计 ”了 data governance 的内容。.
工程主管 是面向领域的 data platform 的领导者。他们负责构建平台的通用功能,并制定全球标准,以确保各领域之间的互操作性。向用例团队提供高质量 data 产品的责任分散到这些团队中。 领域开发团队最接近 data。.
为确保 data 产品的质量,领域开发团队依赖于Data 管理员 以保证高水平的 data 质量和可用性。Data 管理员不是一个角色,而是一份全职工作,处于业务、IT 和 data 团队之间的十字路口。他们协调各方努力弥补 data governance 欠账,并确保新服务 “按设计 ”进行管理。.
用例和功能团队 使用 data 的用户被视为拥有权利和义务的客户:
结论
尽管今天的大多数行动者仍徘徊在第二和第三阶段之间,但他们都感受到了在这一学习过程中向前迈进的商业紧迫性。.
3 个主要论点证明了这种紧迫性。首先,data/人工智能转型是实现新增长动力宏伟目标和保持领先地位的关键杠杆,没有 data governance 的 data 转型是不可持续的。其次,我们身处一个快速发展的世界,要想做出快速反应,就必须迅速获取 data、快速分析和利用 data。最后,企业需要吸引越来越愿意成为 data-driven 的新人才。.
任何公司在开始 data governance 之旅的过程中,首先面临的挑战之一就是展示这种紧迫性,并让内部利益相关者相信具体启动 data governance 计划的价值。.
贡献者:非常感谢 Justine Nerce、Killian Gaumont、Violaine Berland、Sophie Xu、Alexandra Coillard 和 Marc-Antoine Paing。 Artefact

博客







