我们负责比荷卢地区的咨询总监蒂斯·卡博(Ties Carbo)最近发现,Funnel对数据治理的观点还需要进一步完善和澄清。在接受Funnel采访时,他深入探讨了数据治理中需要考虑的关键策略。

在 Funnel,他们并不害怕承认自己有时会犯错。不过,与其说是“犯错”,不如说只是信息不够全面。毕竟,我们终究只是凡人——尽管我们每天都要处理海量的数据。

最近,一位敏锐的观察者阅读了Funnel 关于数据治理的最新文章时,就遇到了这种情况。虽然该文章涵盖了数据治理范畴内的诸多话题,但或许在某些方面缺乏必要的背景信息,也缺少对此问题的前瞻性视角。

幸运的是,这位读者并非泛泛之辈。他正是Artefact Funnel 解决方案合作伙伴Artefact 的咨询总监Ties Carbo。巧合的是,Ties 恰好是现代数据治理领域的专家,他每天都在与客户合作,构建一流的数据治理架构。因此,他们决定坐下来,请他分享对这篇文章中遗漏内容的独到见解。

人们对数据治理的三大误解

在谈话伊始,蒂斯指出,在他看来,客户对这一话题最常产生误解的主要有三个方面。

首先,许多人认为这仅仅是一个IT问题。原因不难理解。数据治理涉及许多可能相当复杂的技术要素,例如模型、流程和平台。然而,在蒂斯看来,妥善治理的影响远不止于IT领域。

“当然,数据治理涉及许多技术环节,”蒂斯说,“但这关乎整个组织。”

这正印证了第二个误解:人们以为这仅仅关乎合规。

事实上,这个话题涵盖的内容远不止于此。围绕《通用数据保护条例》(GDPR)等问题的合规性,仅仅是完善的数据治理如何影响整个组织的一个方面。实际上,Ties 通常建议客户将合规问题作为构建新数据治理架构的最后一步来处理。

这就引出了我们的第三个误解。

据蒂斯称,许多团队在处理数据治理问题时彼此之间缺乏协作。组织中的一部分团队虽负责数据治理,但仅关注合规性;而另一部分团队则致力于确保数据仓库中的数据质量达标,等等。

正确的做法是将这一切视为一个整体,就像一个庞大的数据生态系统。当你开始从更广阔的视角看待数据治理时,你很快就会明白,这其实是关乎整个企业的重大问题。

米其林星级数据治理

Ties 喜欢将数据治理比作一个厨房。你需要尽可能保持厨房的整洁。这种整洁(以及打扫的行为)可以理解为你的数据合规职责、政策和流程。不过,你总得在这个厨房里做饭吧?否则,你建厨房是为了什么呢?

确保所有厨具各就其位、锅碗瓢盆准备就绪、副厨经过妥善培训、严格遵循食谱,以及将菜肴呈献给宾客,这些都构成了数据治理的其余部分。

看吧?整洁的厨房能助您打造绝佳的用餐体验,正如数据治理能助您从数据中挖掘价值一样。

那么,数据治理究竟是什么?

好的。我们知道合规性只是整个数据治理概念的一部分。那么其余部分呢?据Ties所述,数据治理主要包括四个组成部分:数据结构、数据政策、数据运营模式以及数据工具。

  • 数据结构:不妨将其视为你的模型和地图。它们能帮助你了解数据的位置及其内容。回到厨房的比喻,主厨应该清楚厨房内每个工作台的位置。此外,每位厨师也应该知道自己备料(mise en place)的各个部分存放于何处。

  • 数据政策:这些是您制定的规则。没错,合规性要求包含在其中,但数据质量政策同样如此。您需要制定数据维护的标准。在厨房里,主厨需要制定食谱,确保食谱得到严格遵循,并在每道菜上桌前进行品尝——以确保每道菜的摆盘都完美无缺。

  • 数据运营模式:假设您已经建立了数据架构并制定了相关政策。您仍需明确组织内各数据维度的责任归属。例如,谁负责确保销售数据的准确性?谁能发现数据中的错误?

    用厨房来打比方的话,主厨需要根据厨师的专长,将他们分配到各个岗位。随后,这些位于企业不同领域(即厨房)的厨师,便会根据各自的具体需求来管理自己的岗位。

  • 数据工具:这一点相当直观。该重点领域涉及您用于管理数据的各种数据堆栈组件。对于刚刚开启数据治理之旅的企业而言,这些工具可能仅限于 Excel 表格和 Visio 图表。但对于更成熟的企业来说,则会采用专门的工具,包括数据血统、元数据管理、数据质量管理等。

数据治理的理想模式

在交谈中,Ties提到,在他接触的许多组织中,数据治理往往是一个被忽视的问题。不过,情况似乎正在慢慢发生变化。

随着企业领导者逐渐意识到数据作为战略资产的重要性,他们也开始认识到良好治理的价值。

就连各个部门也逐渐意识到,数据治理已不再仅仅是 IT 部门的问题。例如,在市场营销领域,我们深知高质量数据的价值。但只有市场营销人员才能在市场营销的语境下评估数据的质量。

“IT团队无法告诉你数据是否正确,”蒂斯说,“他们只能确认数据是否存放在应有的位置。具体负责的团队需要确保数据符合其使用场景的标准。”

据Ties称,数据治理的理想方法是数据网格方法。

“在真正以数据为驱动的公司中,每个人都在同时处理数据,”蒂斯说道。“通过采用联合治理结构,每个人都对数据有着切身的利益,并且能够扩展该结构。”

人工智能时代的数据治理

这种现代数据治理方法——即组织中的每个人都“拥有”一部分数据——正变得越来越重要。新兴的生成式人工智能工具便是明证。

虽然许多人普遍了解ChatGPT,但凭借其开源特性,其底层技术可用于开发专有AI工具。例如,企业可以将GPT-3或GPT-4部署到其拥有的独立服务器上,并向其输入大量专有数据,从而打造出定制化的、针对特定业务的AI系统。

一家SaaS公司可能希望部署类似的系统,以打造一个知识丰富的聊天机器人,用于回答现有客户和潜在客户的问题。它可以指导用户如何最佳地使用产品,或者向潜在客户说明某款软件为何优于其他产品。

不过,这款AI工具的效果完全取决于你输入的数据质量。

“你能为这些工具提供的数据(及其质量)是你的竞争优势,”蒂斯说道。“良好的数据治理是其中关键的一环。如果没有适当的治理,数据很快就会变得一团糟,从而导致人工智能的效能下降。”

“拥有更完善数据和数据治理架构的公司将占据优势。”
Ties Carbo,比荷卢地区咨询总监

收获良好数据治理带来的回报

每家企业都需要制定适合自身情况的数据治理方案。然而,若以数据网格(Data Mesh)作为指引方向的北极星,您便能踏上提升竞争力、获得更佳数据成果的道路。

无论您是希望提升数据质量、满足新市场的合规要求、部署新工具,还是有其他需求,采取一种战略性且全面的数据治理方法都将助您走得更远。

如有关于数据治理的疑问,欢迎随时 联系我们