En este artículo, Pascal Coggia, socio director de Artefact UK, explica qué es y qué no es Data Mesh, por qué es tanto una mentalidad como un enfoque, y sus casos de uso, ventajas y retos.

¿Qué es la malla Data ? ¿En qué se diferencia de un lago data ?

El arquitecto original del término es Zhamak Dehghani, consultor de Thoughtworks y evangelizador de la descentralización data . En términos sencillos, Data Mesh es un enfoque de arquitectura distribuida para la gestión analítica de data. Permite a los usuarios finales acceder y consultar fácilmente data allí donde reside, sin transportarla primero a un data lago o almacén. Una estrategia descentralizada de Data Mesh trata data como un producto y proporciona a los equipos de dominios específicos la propiedad de data a través de una plataforma de autoservicio que ha incorporado la gobernanza de data .

Data Los lagos son áreas de almacenamiento mínimamente controladas para dominios en bruto data. Fueron concebidos para proporcionar acceso ilimitado a data en un intento de evitar el cuello de botella de los almacenes centralizados y estrictamente gobernados de data , pero tendían a sufrir problemas de mala calidad de data y de descubribilidad. Algunos proyectos de lagos gobernados por data han abordado estos problemas con cierto éxito, pero tienden a reducir la accesibilidad relativa de data . Data Mesh pretende resolver estos problemas mediante la descentralización, evitando así por completo los llamados "pantanos dedata ".

¿Qué se entiende por "data como producto"?

Yo lo veo un poco como la tienda de aplicaciones. Simplemente descargas una aplicación cuando quieres hacer otra cosa. ¿Por qué no iba a ser así con data? Piénsalo estructuralmente: ¿cuáles son los componentes de un producto data ?

  • Tiene que ser fácil de encontrar: la gente tiene que poder encontrar el producto data ;

  • Tiene que ser accesible: la gente tiene que saber cómo interactuar con él;

  • Tiene que ser autodescriptivo;

  • Tiene que ser seguro y fiable; tiene que ofrecer interoperabilidad.

Todo esto sugiere que un producto data se asienta sobre un tejido que le permite interactuar. No está aislado. No puedes simplemente juntar algunos data y meterlos en un cubo de S3 y llamarlo producto data . Tienes que envolver la propiedad y la gobernanza a su alrededor.

¿Cuáles son las ventajas para las empresas?

Son muchas las ventajas que Data Mesh puede ofrecer a las organizaciones y a los equipos multidisciplinares:

  • Al descentralizar data, mejora la velocidad y la accesibilidad, por lo que data es mucho más descubrible y consumible para todos los usuarios de Compañia.

  • Como los equipos incorporan su propia data y gestionan sus propios productos de data , pueden visualizarla y operacionalizarla como mejor les parezca, lo que impulsa la innovación.

  • La toma de decisiones y el tiempo de comercialización se acelerarán, lo que impulsará el aumento de los ingresos y mejorará el compromiso y la retención de los clientes y, en última instancia, reducirá los costes.

  • Y la agilidad empresarial en general mejora con ello, ya que las capacidades de los productos sólo se establecen donde se necesitan, no de forma empresarial.

¿Cuáles son los retos para la adopción de Data Mesh?

Es importante recordar que la malla Data no sólo requiere un cambio tecnológico, sino también de mentalidad. Las organizaciones tienen que aprender a pensar en data como un producto, en la gobernanza y la propiedad de data . Pasar de la propiedad centralizada a la descentralizada y de la canalización al producto, donde los dominios data son la primera preocupación, va a llevar tiempo.

Otros problemas son los citados por Deloitte:

  • Duplicación de data entre distintos dominios: cuando data se reutiliza para satisfacer las necesidades de un nuevo dominio que difiere del dominio de origen, surgen redundancias que pueden repercutir en la utilización de los recursos y en el coste de la gestión de data .

  • Implementar la gobernanza federada de data y el cumplimiento de la calidad: con la coexistencia de productos y conductos independientes de data , es fácil que se pasen por alto los principios de calidad, lo que da lugar a una gran deuda técnica. Estas responsabilidades y principios deben identificarse y federarse adecuadamente.

  • Se requiere una importante gestión del cambio: para adoptar las operaciones descentralizadas de Data Mesh, será necesario un importante esfuerzo de gestión del cambio.

  • Las opciones tecnológicas determinan las capacidades generales de la plataforma data . Por lo tanto, las opciones tecnológicas estandarizadas en toda la organización y preparadas para el futuro para todas las capacidades necesarias de data deben abordarse de forma práctica. Las decisiones tecnológicas inadecuadas pueden dar lugar fácilmente a productos data que aumenten la deuda técnica con el tiempo.

  • Data Mesh no está diseñado para consolidar todos los data de la empresa en un único informe: Aunque el objetivo global es la accesibilidad de data , debe haber libertad dentro de un marco. En Data Mesh, la propiedad de data y las habilidades de data se distribuyen entre equipos de dominio interfuncionales, por lo que los elementos clave, como un marco de metadatos coherente y plataformas comunes, siguen formando parte de una implementación satisfactoria de Data Mesh.

¿Cuándo está preparada una Compañia para adoptar una estrategia de malla Data ?

Depende de lo preparado que esté Compañia . Pero también depende de con quién hables. Un Chief Data Officer que haya construido una enorme organización central puede no estar preparado para Data Mesh porque primero tendrá que establecer cómo federar esas funciones. Pero la mayoría de los líderes empresariales entienden la necesidad de democratizar el activo data hacia los bordes y el negocio porque a menudo se sienten frustrados con el enfoque centralizado.

También hay que saber lo que tiene que pasar a nivel de ingeniería para poder controlar y gobernar la malla, porque si no se configura correctamente, puede convertirse en el Salvaje Oeste. Así que hay que seguir una serie de pasos.

  • El primer paso es realizar una revisión de la arquitectura para definir los componentes básicos de una posible arquitectura de malla Data que ya posea Compañia y cómo pueden aprovecharse para empezar a capacitar a las personas para crear equipos de productos.

  • ¿Existe un equipo centralizado que pueda crear la plataforma sobre la que se construirá la malla Data ? Esa plataforma tiene que estar ahí desde el principio. La infraestructura es lo que permite la capacidad de distribución.

  • Garantizar que el proyecto cuenta con el apoyo y el compromiso de la empresa y las partes interesadas para que tenga éxito a todos los niveles.

  • ¿Dispone el proyecto de la inversión necesaria para construir la malla Data , así como de las capacidades para gestionarla? Porque ambas cosas son esenciales.

  • Una vez completados estos pasos, es hora de empezar a crear los equipos de producto.

La transición a la malla Data es un proceso gradual, porque todos los elementos que ya existen (lagos data , almacenes data ) deben conectarse a la malla Data , no pueden descartarse. La gente querrá esa información y el valor y la gobernanza que ya les rodea.

¿Qué tipo de empresas están implantando con éxito Data Mesh?

En estos momentos, Data Mesh se está adoptando con éxito en el sector de los servicios financieros. ING es un buen ejemplo. Tiene sentido que los bancos utilicen Data Mesh: permite una gobernanza data más sólida, por lo que Servicios aumenta la seguridad. Con Data Mesh, los sistemas de detección del fraude no necesitan conectarse a otros sistemas y extraer el mismo data todos los días. En su lugar, las organizaciones pueden crear productos data centrados en el dominio que sus expertos en detección de anomalías pueden utilizar para crear mejores modelos y resultados.

Zalando, que es la principal plataforma en línea de moda de Europa, descentralizó su data en 2020 y convirtió su enorme lago data en una malla Data . En cuanto a otros sectores, tendremos que ver cómo va caso por caso. Porque cualquier caso de negocio que se cree para Data Mesh tendrá que adaptarse a los retos específicos de la organización -y del sector-, y éstos están en constante cambio.

Data Las estrategias de gestión evolucionan constantemente y las organizaciones deben estar preparadas para adaptarse a los cambios a fin de seguir siendo competitivas. Data Mesh es una forma de acabar con los silos de los engorrosos sistemas de arquitectura monolítica y descentralizar data para conseguir responsabilidad y escalabilidad de extremo a extremo. La cuestión es si Data Mesh es adecuado para su empresa, o no, o todavía no.