class="lazyload

NOTICIAS / DATA CONSULTING

28 de octubre de 2020
Data han revolucionado la forma en que las marcas almacenan, analizan y utilizan data , pero para utilizarlas de manera más eficiente deben empezar a incorporar la gobernanza de data como código, escriben Justine Nerce, Directora de Consultoría de Data , y Jean-Baptiste Charruey, Director de Ingeniería de Data , en Artefact.

A medida que las economías mundiales comienzan a recuperarse del shock inicial del coronavirus, podemos esperar un periodo de consolidación y reevaluación por parte de las empresas. Sin embargo, la necesidad de innovación no va a ninguna parte aunque los presupuestos sean ajustados. El lanzamiento de nuevos productos y servicios representa más del 25% de los ingresos y beneficios totales.

 

La innovación debe guiarse por una data precisa y de alta calidad. Sin embargo, para que esto sea posible, las empresas necesitan una base de data fácilmente accesible, documentada y normalizada en la que basarse. Los ciclos de desarrollo de nuevos productos y servicios son cada vez más cortos y competitivos, por lo que las organizaciones deben evolucionar su enfoque de data para seguir el ritmo.

 

El auge de las plataformas de data ha servido a las empresas para acelerar el acceso a data, especialmente a aquellas que buscan construir la próxima generación de soluciones AI . Sin embargo, está claro que las marcas necesitan ahora un enfoque más sólido, eficiente y cualitativo para que sus plataformas de data sean agnósticas en cuanto a casos: mantenibles, operativas y escalables para cualquier infraestructura cloud, on-prem o híbrida.

 

Auge y declive de la plataforma data

Las empresas revolucionan constantemente su enfoque de data para obtener ventajas en el mercado. A lo largo de las décadas, los almacenes data -grandes depósitos de data filtrada- han dado paso a los lagos data -vastos almacenes centralizados de materia prima sin refinar data. Sin embargo, estos enormes almacenes de data han resultado poco manejables y difíciles de gobernar. Los plazos se alargaron porque no existía un proceso claro y ágil para agilizar el desarrollo.

Como consecuencia, lo que estamos viendo es el paso de los entornos monolíticos de antaño a una arquitectura data más distribuida, basada en múltiples plataformas data . Se trata de conjuntos de software y servicios que rodean un data lago para ayudar a que el data sea más explotable. Las organizaciones suelen construir múltiples plataformas data para cada ámbito empresarial y para cada nuevo proyecto. Esto proporciona a los equipos de desarrollo un acceso rápido a data y a los conocimientos que necesitan para crear nuevo valor empresarial que responda a sus necesidades actuales.

Sin embargo, con la descentralización llegan la fragmentación y la duplicación. Muchas empresas dedican enormes cantidades de tiempo y recursos a construir una plataforma data para un entorno concreto. Luego tienen que volver a hacerlo para el siguiente proyecto o caso de uso, con importantes discrepancias en función de los conocimientos técnicos del equipo. Los costes se multiplican varias veces, ya que los equipos empiezan prácticamente de cero cada vez que se inicia un nuevo proyecto.

Gran parte del trabajo más valioso que hacen las empresas hoy en día -incluido el que se realiza en torno a Inteligencia Artificial - es interdepartamental e interdominio. Para aprovechar todo su potencial, los equipos y las distintas plataformas de data deben compartir un data de alta calidad, pero ¿cómo mantener la calidad cuando data está sujeto a una serie de políticas contradictorias? Hay que encontrar un compromiso entre dar a los equipos la propiedad local de data para personalizar y crear, y la estandarización del enfoque para construir una base tecnológica sólida.   

Introduzca la malla data 

Sin algún tejido de conexión entre los distintos dominios, las plataformas data no conseguirán ofrecer la calidad data y la rentabilidad que las marcas necesitan para un desarrollo rápido. Afortunadamente, tienen una forma de evolucionar su enfoque. Deben hacer evolucionar su arquitectura data de una colección dispar de plataformas data a lo que Zhamak Dehghani define como una "malladata "..

Una malla data es una arquitectura en la que las plataformas distribuidas data , propiedad de equipos interfuncionales independientes, están conectadas mediante una "malla" de políticas, gobernanza y herramientas comunes. Este enfoque aporta flexibilidad y resistencia a las plataformas data al establecer una base compartida, al tiempo que da a los equipos la libertad de personalizar su propio dominio.

 

Este planteamiento hace que una plataforma data pase de ser un proyecto de una sola vez a un activo a largo plazo, eliminando la duplicación de trabajo y el gasto innecesario de recursos. Sin embargo, el inconveniente de la malla data es que los equipos individuales tienen que hacer mucho trabajo para garantizar que se ha completado la industrialización. Esto puede llevar mucho tiempo con un resultado que dista mucho de ser perfecto. Disponer de una plantilla que gestione todos los requisitos para lograr una solución lista para la producción es clave. Pero, ¿qué forma debe adoptar esta plantilla? 

El componente principal es un conjunto de códigos comunes que se asientan en todas las plataformas de data . Este "centineladata " es una mezcla de soluciones que facilitan el tratamiento y análisis de los data y la transición a la industrialización. Su función es supervisar y racionalizar todos los flujos de data -como la recopilación de metadatos y la limpieza- mediante el desarrollo de módulos en torno a la calidad y la documentación de data .

Un centinela data libera a los equipos y especialistas de data de las tareas mundanas y repetitivas de la gestión de data . En su lugar, pueden centrarse en tareas más estratégicas e innovadoras que crean nuevo valor para la empresa

En el núcleo de data sentinel, data la gobernanza como código debe estar firmemente integrada en el diseño de la plataforma y continuarse con cada nuevo caso de uso. Gracias a data governance as code, data es desde el principio "propio", de alta calidad, documentado, seguro y conforme, así como fácilmente accesible a través de modelos data en toda la organización.

Hacer de la innovación algo corriente

Data Las plataformas deben ser productos en evolución, pensados para data activación y rápido valor empresarial. Cuando se mutualizan entre diferentes casos de uso y requisitos, hacen que la innovación y la invención sean más rápidas y rentables. De hecho, la mutualización de servicios puede reducir la velocidad de implementación en un 40%, ayudando a los departamentos a generar valor al ofrecer la calidad y variedad data necesarias para sus casos de uso.

Las empresas tienen un flujo constante de nuevos casos de uso y productos que desarrollar, especialmente en el clima actual. Un enfoque mutualizado de la gobernanza como código en data ofrece un proceso integral que permite industrializar realmente estos casos de uso. Gracias a una solución robusta y con muchas plantillas, data puede compartirse fácilmente entre proyectos y equipos. No se pierde tiempo cuando se necesita información para un nuevo producto

 

La tecnología por sí sola no basta. Para que la plataforma data funcione, hay que adoptar un enfoque iterativo y transversal. Es la única manera de hacer que la innovación sea habitual en tu Compañia.

Publicado por primera vez por ITPortal.com

class="lazyload

¿Le interesa el marketing digital y data ?

Suscríbase a Data Digest, el boletín de Artefact, para recibir consejos prácticos, ideas y opiniones en su bandeja de entrada cada mes.

¡Apúntame!