Neste artigo, Pascal Coggia, sócio-gerente da Artefact UK, explica o que é e o que não é o Data Mesh, por que ele é tanto uma mentalidade quanto uma abordagem, e seus casos de uso, benefícios e desafios.

O que é Data Mesh? Qual é a diferença entre ela e um lago data ?

O arquiteto original do termo é Zhamak Dehghani, consultor da Thoughtworks e divulgador da descentralização data . Em termos simples, Data Mesh é uma abordagem de arquitetura distribuída para o gerenciamento de dados analíticos data. Ela permite que os usuários finais acessem e consultem facilmente data onde ele reside, sem primeiro transportá-lo para um lago ou armazém data . Uma estratégia descentralizada de Data Mesh trata o data como um produto e fornece às equipes específicas do domínio a propriedade do data por meio de uma plataforma de autoatendimento que tem a governança data incorporada.

Data Os lagos são áreas de armazenamento minimamente controladas para domínios brutos data. Eles foram criados para fornecer acesso ilimitado a data em uma tentativa de evitar o gargalo dos armazéns data centralizados e rigidamente controlados, mas tendem a sofrer com a baixa qualidade de data e problemas de descoberta. Alguns projetos governados de data lake abordaram esses problemas com um mínimo de sucesso, mas, como resultado, tendem a reduzir a acessibilidade relativa do data . Data O Mesh tem como objetivo solucionar esses desafios por meio da descentralização, evitando assim totalmente os chamados "pântanosdata ".

O que significa "data como um produto"?

Penso nisso um pouco como a loja de aplicativos. Você simplesmente baixa um aplicativo quando quer fazer outra coisa. Por que não deveria ser assim com o data? Pense nisso estruturalmente: quais são os componentes de um produto data ?

  • Ele precisa ser detectável: as pessoas precisam ser capazes de encontrar o produto data ;

  • Ele precisa ser endereçável - as pessoas precisam saber como interagir com ele;

  • Ele precisa ser autodescritivo;

  • Ele precisa ser seguro e confiável; precisa oferecer interoperabilidade.

Tudo isso sugere que um produto data está em um tecido que permite sua interação. Ele não está isolado. Você não pode simplesmente juntar um pouco de data , colocá-lo em um bucket S3 e chamá-lo de produto data . É preciso envolver a propriedade e a governança em torno dele.

Quais são os benefícios para as empresas?

Há muitos benefícios que o Data Mesh pode oferecer às organizações e às equipes de domínio multifuncionais:

  • Ao descentralizar o data, ele aumenta a velocidade e a acessibilidade, de modo que o data é muito mais detectável e consumível para todos os usuários da empresa.

  • Como as equipes integram seu próprio data e gerenciam seus próprios produtos data , elas podem visualizá-lo e operacionalizá-lo como acharem melhor, o que impulsiona a inovação.

  • A decisão e o tempo de colocação no mercado serão acelerados, o que gerará maior receita e melhor envolvimento e retenção do cliente e, por fim, reduzirá os custos.

  • E a agilidade dos negócios em geral é aprimorada com isso, já que os recursos do produto são configurados apenas quando necessário, e não em uma base empresarial.

Quais são os desafios para a adoção do Data Mesh?

É importante lembrar que a Data Mesh não exige apenas uma mudança tecnológica, mas também uma mudança de mentalidade. As organizações precisam aprender a pensar no data como um produto, na governança e na propriedade dodata . Mudar os negócios de propriedade centralizada para descentralizada e mudar as organizações de pipelines para produtos, em que os domínios data são a preocupação de primeira classe, vai exigir algum esforço.

Alguns outros problemas incluem os citados pela Deloitte:

  • Duplicação do data entre domínios diferentes: quando o data é redirecionado para atender às necessidades de um novo domínio diferente do domínio de origem, surgem redundâncias que podem ter um impacto potencial na utilização de recursos e no custo do gerenciamento do data .

  • Implementação da governança federada do data e da conformidade com a qualidade: com a coexistência de produtos e pipelines independentes do data , os princípios de qualidade podem ser facilmente ignorados, resultando em um extenso débito técnico. Essas responsabilidades e princípios devem ser identificados e federados adequadamente.

  • É necessário um gerenciamento de mudanças significativo: para adotar operações descentralizadas do Data Mesh, serão necessários esforços substanciais de gerenciamento de mudanças.

  • As escolhas tecnológicas determinam os recursos gerais da plataforma data . data Portanto, as escolhas de tecnologia que são padronizadas em toda a organização e preparadas para o futuro para todos os recursos necessários devem ser abordadas de forma prática. Decisões tecnológicas inadequadas podem facilmente resultar em produtos data que aumentam a dívida técnica ao longo do tempo.

  • Data O Mesh não foi projetado para consolidar todos os data de toda a empresa em um único relatório: Embora o objetivo principal seja a data acessibilidade, deve haver liberdade dentro de uma estrutura. No Data Mesh, a data propriedade e as data habilidades são distribuídas entre as equipes de domínio multifuncional, de modo que os principais elementos, como uma estrutura de metadados consistente e plataformas comuns, continuam sendo parte de uma implementação bem-sucedida do Data mesh.

Quando uma empresa está pronta para adotar uma estratégia de malha Data ?

Depende do grau de preparação da empresa. Mas também depende de com quem você está falando. Um executivo-chefe de Data que tenha criado uma organização central enorme pode não estar pronto para a Data Mesh, pois precisará primeiro estabelecer como federar essas funções. Mas a maioria dos líderes de negócios entende a necessidade de democratizar o ativo data em direção às bordas e aos negócios, pois muitas vezes se sentem frustrados com a abordagem centralizada.

Você também precisa saber o que deve acontecer em nível de engenharia para poder controlar e governar a malha, pois se não for configurada corretamente, pode se transformar em um faroeste. Portanto, há uma série de etapas a serem seguidas.

  • A primeira etapa é realizar uma análise da arquitetura para definir os componentes principais de uma possível arquitetura do Data Mesh que a empresa já possui e como eles podem ser aproveitados para começar a capacitar as pessoas a criar equipes de produtos.

  • Existe uma equipe centralizada que possa criar a plataforma sobre a qual a Malha Data será construída? Essa plataforma precisa estar presente desde o início. A infraestrutura é o que permite a capacidade de distribuição.

  • Garantir que o projeto tenha o apoio e o envolvimento da empresa e das partes interessadas para que seja bem-sucedido em todos os níveis.

  • O projeto tem o investimento necessário para criar a malha Data , bem como os recursos para gerenciá-la? Porque ambos são essenciais.

  • Depois que essas etapas forem concluídas, é hora de começar a formar as equipes de produtos.

A transição para uma malha Data é uma jornada incremental porque todos os elementos que você já tem - data lakes, data warehouses - precisam se conectar à malha Data , não podem ser descartados. As pessoas vão querer essas informações, o valor e a governança que já estão envolvidos nelas.

Que tipos de empresas estão implantando com sucesso o Data Mesh?

No momento, o Data Mesh está sendo adotado com sucesso no setor de serviços financeiros. O ING é um bom exemplo. Faz sentido que os bancos usem o Data Mesh - ele oferece suporte a uma governança mais forte do data , portanto, oferece maior segurança. Com o Data Mesh, os sistemas de detecção de fraudes não precisam se conectar a outros sistemas e obter o mesmo data todos os dias. Em vez disso, as organizações podem criar produtos data focados no domínio que seus especialistas em detecção de anomalias podem usar para criar modelos e resultados melhores.

A Zalando, que é a principal plataforma on-line de moda da Europa, descentralizou seu data em 2020 e transformou seu enorme lago data em uma malha Data . Quanto a outros setores, teremos que ver como será a situação caso a caso. Porque qualquer caso de negócios que você criar para a Data Mesh precisará ser adaptado aos desafios específicos da organização - e do setor - e esses desafios estão em constante mudança.

Data As estratégias de gerenciamento estão sempre evoluindo e as organizações precisam estar preparadas para se adaptar às mudanças a fim de se manterem competitivas. Data O Mesh é uma maneira de eliminar os silos de sistemas de arquitetura monolítica pesados e descentralizar o data para obter responsabilidade e escalabilidade de ponta a ponta. A questão é se o Data Mesh é adequado para sua empresa - ou não, ou ainda não - é a questão.