Autor

Autor

Autor

En la era digital actual, las organizaciones se enfrentan al reto de mantenerse al día con el ritmo sin precedentes de data y con la gran cantidad de sistemas empresariales y tecnologías digitales que recopilan todo tipo de data. A esto se suma la necesidad de analizar de forma rápida y eficiente estos grandes volúmenes de data obtener información y conocimientos que permitan maximizar su valor empresarial. Como resultado, data big data se han convertido en una base esencial para que las organizaciones implementen de manera eficiente data que permitan tomar decisiones empresariales oportunas data y obtener una ventaja competitiva.

«Las solucionesData e inteligenciaData se están extendiendo por todas las organizaciones para impulsar el crecimiento empresarial. Las organizaciones deben crear data big data que sirvan de base sólida para implementar data a gran escala. Estas data deben diseñarse específicamente para el negocio, ya que su eficacia depende de la información y la inteligencia empresarial que permitan obtener; además, deben diseñarse con visión de futuro, de modo que puedan beneficiarse de los constantes avances en los servicios y tecnologías data ».
Oussama Ahmad, socio Data en Artefact

Objetivos principales de la Data de big Data

data big data tienen como objetivo eliminar data e integrar los distintos tipos de data necesarios para implementar soluciones avanzadas data e inteligencia data . Ofrecen una infraestructura escalable y flexible para recopilar, almacenar y analizar grandes volúmenes de data múltiples fuentes. Estas plataformas deben aprovechar los mejores servicios y tecnologías data disponibles y cumplir tres objetivos clave:

  • Centralizar data : una data big data debe eliminar data mediante la ingesta y el almacenamiento automáticos data de distintos tipos y tamaños, procedentes tanto de data de la empresa como data de terceros. Debe convertirse en el data central data , proporcionando una única fuente de información fiable para todas data necesarias para las soluciones data .

  • Habilitar soluciones data : una data big data debe proporcionar una infraestructura sólida para desarrollar, ejecutar e implementar diferentes tipos de soluciones de análisis (desde simples informes hasta técnicas avanzadas de aprendizaje automático), según sea necesario, con el fin de satisfacer las necesidades empresariales de información y conocimientos para la toma de decisiones.

  • Garantizar un acceso seguro y conforme a la normativa a data las aplicaciones: con una data big data , las organizaciones deben poder ofrecer data consolidado y seguro data tanto a las partes interesadas internas como a las externas. Asimismo, debe almacenar, procesar y distribuir data manera que se cumplan data y normativas locales data , así como las normas internacionales y las mejores prácticas.

Infraestructura de la Data de big Data

Existen varias opciones de infraestructura para una data big data : totalmente local, totalmente cloud híbrida cloud, cada una con sus propias ventajas y retos. Las organizaciones deben tener en cuenta una serie de factores a la hora de elegir la opción de infraestructura más adecuada para su data big data , entre los que se incluyen los requisitos data y residencia data , las integraciones data , los requisitos de funcionalidad y escalabilidad, así como el coste y el tiempo. Una arquitectura totalmente cloud Servicios costes Servicios y predecibles, servicios e integraciones listos para usar y una rápida escalabilidad, pero carece de control sobre el hardware y puede no cumplir con las normativas data y residencia data . Una arquitectura totalmente local proporciona un control total sobre el hardware y data , suele cumplir con las normativas de privacidad y residencia, pero conlleva costes más elevados y requiere una planificación a largo plazo para la escalabilidad. Una arquitectura híbrida cloud Servicios mejor de ambos mundos, facilitando la migración completa a la cloud una fecha posterior, pero puede requerir una configuración más compleja.

Muchas organizaciones optan por una infraestructura híbrida para sus data big data debido a requisitos organizativos que les obligan a mantener data altamente confidenciales data como data de clientes y financieros) en sus propios servidores, o debido a la falta de proveedores cloud (CSP) certificados por el gobierno que cumplan con los requisitos locales data y residencia data . Estas organizaciones también prefieren mantener en la cloud data cloud o no confidenciales cloud optimizar los costes de almacenamiento y recursos informáticos, y aprovechar los servicios data y aprendizaje automático listos para usar que ofrecen los CSP. Otras organizaciones que no tienen requisitos organizativos o normativos sobre data dentro de la Compañia del país optan por una infraestructura totalmente cloud para acelerar la implementación, optimizar los costes y disponer de recursos fácilmente escalables.

class="lazyload

Figura 1: Infraestructura Data Cloud híbrida Cloud local

Una data big data suele implicar la configuración de siete capas principales que reflejan el data , desde datahasta la «información» y los «conocimientos». Las organizaciones deben analizar detenidamente los servicios y herramientas adecuados que requiere cada una de las capas para garantizar un flujo de datos fluido y una generación eficiente de data . Estos servicios y herramientas deben desempeñar funciones clave en cada capa de la data big data , tal y como se muestra en la Figura 2: Data Data big Data .

class="lazyload

Figura 2: Data de Data de big Data

Evolución de la Data de big Data

El desarrollo de una data de big data debe seguir varias etapas, comenzando con una plataforma mínima viable (MVP) y continuando con actualizaciones graduales. Una organización debe sincronizar la evolución de su data big data con los crecientes requisitos de data y conocimientos más amplios y rápidos data para la toma de decisiones empresariales. Estos requisitos crecientes afectan a la complejidad de la data big data en cuanto a soluciones data , volúmenes y tipos data , y usuarios internos y externos. La evolución de la data big data incluye la incorporación de más recursos de almacenamiento y computación, características y funcionalidades avanzadas, y mejoras en la seguridad y la gestión de la plataforma.

class="lazyload

Anexo 3: Evolución de las Data de big Data

«Hemos observado que muchas organizaciones tienden a crear data big data con funciones avanzadas e innecesarias desde el primer momento, lo que aumenta el coste total de propiedad de la tecnología. La implantación data big data debe comenzar con una plataforma mínima viable y evolucionar en función de los requisitos empresariales y tecnológicos. En las primeras fases de la creación de la plataforma, las organizaciones deben implementar una sólida estructura data y gestión data que garantice data , la privacidad y la seguridad data , así como el cumplimiento de data local y regional data ».
 Anthony Cassab, director Data en Artefact

Directrices para una Data big Data preparada para el futuro

data big data debe diseñarse siguiendo unas directrices arquitectónicas clave para garantizar su viabilidad a largo plazo, de modo que permita una fácil escalabilidad de los recursos, la portabilidad entre diferentes cloud locales y cloud , la actualización y sustitución de servicios, y la ampliación de los mecanismos data y intercambio data .

  • data modulares: Todas las capas de la plataforma deben estar bien definidas e integradas, desde la capa data hasta la capa data y de inteligencia empresarial. Cada capa debe aprovechar los mejores servicios o herramientas de su clase, lo que suele requerir que la arquitectura no se base en una solución de «caja negra» y permita la configuración e integración de herramientas y servicios independientes que ofrezcan funcionalidades específicas.

  • Aplicaciones en contenedores: La plataforma debe contenerizar los procedimientos y las aplicaciones data , procesamiento y análisis data mediante plataformas de orquestación como Kubernetes. Los contenedores ofrecen un mecanismo de empaquetado lógico que permite abstraer las aplicaciones del entorno de ejecución, lo que facilita la ejecución de cargas de trabajo en contenedores en diversos tipos de infraestructura. Esto facilita la portabilidad de las aplicaciones de la plataforma entre diferentes cloud locales y cloud , así como su implementación en múltiples nubes.

  • Arquitectura basada en microservicios: Las aplicaciones de la plataforma deben dividirse en microservicios, cada uno de los cuales desempeña una función específica e interactúa con los demás. Esto facilita el desarrollo y el mantenimiento de las aplicaciones, permite la implementación y el escalado independientes de los microservicios, y hace posible la entrega rápida y frecuente de aplicaciones grandes y complejas.

  • Servicios y herramientas estándar: La selección de herramientas y servicios para la plataforma debe centrarse en los estándares comunes del sector (estándares abiertos) y reducir la dependencia de aquellos que son específicos de un único proveedor tecnológico. Por ejemplo, la plataforma debe incluir cloud que sean comunes a varios proveedores cloud . Esto facilita la migración entre diferentes cloud locales y cloud , así comocloud , lo que reduce los costes y el tiempo.

  • data sólida: desde el principio, la plataforma debe incorporar un marco sólido data que incluya herramientas, servicios, procesos, controles y normas que garanticen la supervisión y la mejora continuas de data , el acceso seguro a data data , la protección de la privacidad, el almacenamiento y el tratamiento conformes a la normativa, y una gestión estandarizada data los metadatos. Esto facilita la ampliación de los recursos y las capacidades de la plataforma, así como la adopción generalizada de soluciones data y el uso de los conjuntos de datos disponibles.

«Es preferible una plataforma adaptable y modular, capaz de ampliarse a medida que evolucionan las necesidades empresariales, a una plataforma de «caja negra» que, aunque esté bien integrada, ofrece posibilidades limitadas de personalización. Estas arquitecturas de plataforma pueden implementarse total o parcialmente en la cloud aprovechar las ventajas de cloud , como la escalabilidad y la rentabilidad, al tiempo que cumplen los requisitos de privacidad y seguridad establecidos por la normativa data ».
Faisal Najmuddin, director Data en Artefact

En resumen, una data big data aporta múltiples ventajas a las organizaciones, como la centralización de data , la implementación de soluciones avanzadas data y el acceso a nivel de toda la empresa a las soluciones y fuentes data . Sin embargo, la implementación de una data big data conlleva una serie de decisiones estratégicas, como elegir la infraestructura o infraestructuras adecuadas, adoptar una arquitectura preparada para el futuro, seleccionar servicios estándar y «migrables», considerar cuidadosamente las normativas data y, por último, definir un plan de evolución óptimo que esté estrechamente vinculado a los requisitos empresariales y maximice el retorno de data .