Neste artigo, Pascal Coggia, Managing Partner da Artefact UK, explica o que é e o que não é o Data Mesh, por que ele é tanto uma mentalidade quanto uma abordagem, e seus casos de uso, benefícios e desafios.

O que é a malha Data? Qual é a diferença em relação a um lago data?

O arquiteto original do termo é Zhamak Dehghani, um Thoughtworks consultor e divulgador da descentralização do data. Em termos simples, o Data Mesh é uma abordagem de arquitetura distribuída para gerenciar o data analítico. Ela permite que os usuários finais acessem e consultem facilmente o data onde ele reside, sem primeiro transportá-lo para um lago ou depósito de data. Uma estratégia descentralizada do Data Mesh trata o data como um produto e fornece às equipes específicas do domínio a propriedade do data por meio de uma plataforma de autoatendimento que tem o data governance incorporado.

Os lagos Data são áreas de armazenamento minimamente controladas para o data de domínio bruto. Eles foram criados para fornecer acesso ilimitado ao data em uma tentativa de evitar o gargalo dos armazéns data centralizados e rigidamente controlados, mas eles tendem a sofrer com problemas de baixa qualidade e descoberta do data. Alguns projetos de lago do data governados abordaram esses problemas com um mínimo de sucesso, mas, como resultado, tendem a reduzir a acessibilidade relativa do data. O Data Mesh tem como objetivo resolver esses desafios por meio da descentralização, evitando assim totalmente os chamados “pântanos do data”.

O que significa “data como um produto”?

Penso nisso um pouco como a loja de aplicativos. O senhor simplesmente baixa um aplicativo quando quer fazer outra coisa. Por que não deveria ser assim com o data? Pense nisso estruturalmente: quais são os componentes de um produto data?

  • Ele precisa ser detectável: as pessoas precisam ser capazes de encontrar o produto data;

  • Ele precisa ser endereçável - as pessoas precisam saber como interagir com ele;

  • Ele precisa ser autodescritivo;

  • Ele precisa ser seguro e confiável; precisa oferecer interoperabilidade.

Tudo isso sugere que um produto data está em um tecido que permite sua interação. Ele não está isolado. O senhor não pode simplesmente juntar alguns data, colocá-los em um bucket S3 e chamá-los de produto data. O senhor precisa envolver a propriedade e a governança em torno dele.

Quais são os benefícios para as empresas?

Há muitos benefícios que o Data Mesh pode oferecer às organizações e às equipes de domínio multifuncional:

  • Ao descentralizar o data, ele aumenta a velocidade e a acessibilidade, de modo que o data é muito mais detectável e consumível para todos os usuários da empresa.

  • Como as equipes integram seu próprio data e gerenciam seus próprios produtos data, elas podem visualizá-lo e operacionalizá-lo como acharem melhor, o que impulsiona a inovação.

  • A decisão e o tempo de colocação no mercado serão acelerados, o que gerará maior receita e melhor envolvimento e retenção do cliente - e, por fim, reduzirá os custos.

  • E a agilidade dos negócios em geral é aprimorada com isso, pois os recursos do produto são configurados apenas quando necessário, e não em uma base empresarial.

Quais são os desafios para a adoção do Data Mesh?

É importante lembrar que a malha Data não requer apenas um tecnológico turno, é necessário um mentalidade mudança. As organizações precisam aprender a pensar no data como um produto, no data governance e propriedade. Mudar as empresas de propriedade centralizada para descentralizada e mudar as organizações de pipelines para produtos, em que os domínios data são a preocupação de primeira classe, vai exigir algum trabalho.

Algumas outras questões incluem as citadas por Deloitte:

  • Duplicação do data entre domínios diferentes: quando o data é redirecionado para atender às necessidades de um novo domínio diferente do domínio de origem, surgem redundâncias que podem ter um impacto potencial na utilização de recursos e no custo do gerenciamento do data.

  • Implementação do data governance federado e conformidade com a qualidade: com a coexistência de produtos e pipelines independentes do data, os princípios de qualidade podem ser facilmente ignorados, resultando em um extenso débito técnico. Essas responsabilidades e princípios devem ser identificados e federados adequadamente.

  • É necessário um gerenciamento de mudanças significativo: para adotar operações descentralizadas do Data Mesh, serão necessários esforços substanciais de gerenciamento de mudanças.

  • As escolhas tecnológicas determinam os recursos gerais do data platform. Portanto, as escolhas de tecnologia que são padronizadas em toda a organização e preparadas para o futuro para todos os recursos necessários do data devem ser abordadas na prática. Decisões tecnológicas inadequadas podem facilmente resultar em produtos data que aumentam a dívida técnica ao longo do tempo.

  • O Data Mesh não foi projetado para consolidar todos os data da empresa em um único relatório: Embora o objetivo principal seja a acessibilidade do data, deve haver liberdade dentro de uma estrutura. No Data Mesh, a propriedade do data e as habilidades do data são distribuídas entre as equipes de domínio multifuncional, de modo que os elementos-chave, como uma estrutura metadata consistente e plataformas comuns, continuam sendo parte de uma implementação bem-sucedida do Data Mesh.

Quando uma empresa está pronta para adotar uma estratégia de malha Data?

Depende do grau de preparação da empresa. Mas também depende de com quem o senhor está falando. Um diretor de Data que construiu uma organização central enorme pode não estar pronto para o Data Mesh porque precisará primeiro estabelecer como federar essas funções. Mas a maioria dos líderes de negócios entende a necessidade de democratizar os ativos de data em direção às bordas e aos negócios, porque muitas vezes se sentem frustrados com a abordagem centralizada.

O senhor também precisa saber o que deve acontecer em nível de engenharia para poder controlar e governar a malha, pois se não a definir corretamente, ela pode se transformar em um faroeste. Portanto, há uma série de etapas a serem seguidas.

  • A primeira etapa é realizar uma análise da arquitetura para definir os componentes principais de uma possível arquitetura de malha Data que a empresa já possui e como eles podem ser aproveitados para começar a capacitar as pessoas a formar equipes de produtos.

  • Existe uma equipe centralizada que possa criar a plataforma sobre a qual o Data Mesh será construído? Essa plataforma tem que estar presente desde o início. A infraestrutura é o que permite a capacidade de distribuição.

  • Garantir que o projeto tenha o apoio e o envolvimento da empresa e das partes interessadas para que seja bem-sucedido em todos os níveis.

  • O projeto tem o investimento necessário para construir o Data Mesh, bem como os recursos para gerenciá-lo? Porque ambos são essenciais.

  • Depois que essas etapas forem concluídas, é hora de começar a formar as equipes de produtos.

A transição para a malha Data é uma jornada incremental porque todos os elementos que o senhor já tem - lagos data, armazéns data - precisam se conectar à malha Data, não podem ser descartados. As pessoas vão querer essas informações, o valor e a governança que já estão envolvidos nelas.

Que tipos de empresas estão implementando com sucesso o Data Mesh?

No momento, o Data Mesh está sendo adotado com sucesso no setor de serviços financeiros. ING é um bom exemplo. Faz sentido para os bancos usarem o Data Mesh - ele suporta data governance mais forte, portanto, oferece maior segurança. Com o Data Mesh, os sistemas de detecção de fraudes não precisam se conectar a outros sistemas e extrair o mesmo data todos os dias. Em vez disso, as organizações podem criar produtos data focados no domínio que seus especialistas em detecção de anomalias podem usar para criar modelos e resultados melhores.

Zalando, A empresa de moda, que é a principal plataforma on-line da Europa, descentralizou seu data em 2020 e transformou seu enorme lago data em um Data Mesh. Quanto a outros setores, teremos que ver como será o processo caso a caso. Porque qualquer caso de negócios que o senhor criar para o Data Mesh precisará ser adaptado aos desafios específicos da organização - e do setor - e esses desafios estão em constante mudança.

As estratégias de gerenciamento Data estão sempre evoluindo e as organizações precisam estar preparadas para se adaptar às mudanças a fim de se manterem competitivas. O Data Mesh é uma maneira de acabar com os silos de sistemas de arquitetura monolítica pesados e descentralizar o data para obter responsabilidade e escalabilidade de ponta a ponta. A questão é se o Data Mesh é adequado para sua empresa - ou não, ou ainda não - é a questão.