Tres aspectos no negociables antes de actualizar la pila data a una pila AI

La mayoría de las empresas no están preparadas para sustituir una pila de data de la era de los paneles de control por una pila de AI. El último informe «State of Data & Analytics» de Salesforce indica que el 84% de los responsables de data y análisis afirman que sus estrategias requieren una revisión completa antes de que las ambiciones en materia de AI puedan tener éxito. Los líderes estiman que el 26,1 % de su data no es fiable, solo el 43,1 % cuenta con marcos formales de data governance y alrededor del 50,1 % no confía en su capacidad para generar y ofrecer información oportuna. Al mismo tiempo, el 70 % cree que los insights más valiosos se encuentran en datos no estructurados. La conclusión es clara: el obstáculo no es el entusiasmo, sino los cimientos, y esos cimientos deben cambiar antes de que los sistemas de agencia puedan escalar.

La IA agéntica convierte a los data platforms en sistemas de acción que leen contratos y tickets, vigilan cámaras, escuchan llamadas, correlacionan con registros y eventos, y luego ejecutan. Los cuadros de mando pueden tolerar retrasos, mientras que los agentes no; el cumplimiento puede operar a través de la documentación, pero los agentes requieren controles en tiempo de ejecución. Antes de que cualquier empresa proclame una pila de IA, tres elementos deben ser innegociables: la multimodalidad por defecto, el streaming como modo operativo y la gobernanza como sistema en tiempo de ejecución. Las secciones que siguen traducen estas convicciones en opciones arquitectónicas que soportan cargas de trabajo de agentes a escala de producción.

Multimodal por defecto

Tratar los documentos, las imágenes, el audio, el vídeo y los registros como activos de segunda clase limita la capacidad de los agentes por diseño. Una plataforma adecuada para los agentes almacena tablas y tensores como pares bajo un mismo catálogo con un sistema de linaje unificado y un modelo de acceso coherente, de modo que los soportes de alta dimensión puedan moverse por el mismo ciclo de vida que los relacionales data. En la práctica, esto significa diseños en trozos o en mosaico que permitan lecturas parciales y la extracción de regiones de interés; identificadores dirigidos al contenido con metadata sidecar versionados para que cada artefacto sea reproducible; y formatos nativos de matrices y columnas que permitan el pushdown de predicados y coordenadas. El texto y los documentos requieren incrustaciones como derivado primario que se generen de forma determinista, se versionen con sus fuentes y se indexen con compensaciones claras, por ejemplo, HNSW cuando predomine el recuerdo, IVF PQ cuando deban equilibrarse la memoria y la latencia, e indexación híbrida densa más léxica cuando los códigos y números de producto sean esenciales. La recuperación debe devolver paquetes de pruebas como pasajes, páginas, fotogramas o clips porque los agentes razonan sobre las pruebas en lugar de sobre subcadenas aisladas.

Las mayores ganancias proceden de la fusión, pero ésta sólo es valiosa cuando la alineación se resuelve a nivel de plataforma. La fusión temprana captura las interacciones de grano fino, como la alineación de los tramos de texto con las regiones de imagen, la fusión tardía preserva los modelos específicos de cada modalidad hasta un límite de decisión, y los enfoques híbridos combinan ambos cuando los puntos de interacción están bien definidos. La alineación es la parte difícil. La sincronización temporal de eventos entre fuentes con diferentes frecuencias de muestreo, el registro espacial entre sensores y la vinculación semántica para que un ID de pedido en un PDF, un fotograma de cámara de carril tres, un pico de vibración y un evento del libro mayor se resuelvan en el mismo objeto empresarial son capacidades que pertenecen a la capa de catálogo y linaje. Sin esta noción compartida de tiempo, identidad y procedencia, los agentes alucinarán con el contexto o actuarán basándose en señales obsoletas. Dado que el 70% de los líderes creen que las percepciones más valiosas se encuentran dentro del data no estructurado, la multimodalidad no puede ser un añadido de la fase dos. Es el valor por defecto que desbloquea el contexto.

Streaming como modo de funcionamiento

El trabajo agenético introduce un objetivo central a nivel de servicio: la latencia de decisión, el tiempo que transcurre entre una señal del mundo real y una acción aceptable. Cumplir ese objetivo requiere una plataforma de "streaming first". La columna vertebral es un registro de eventos que actúa como sistema de registro, con esquemas forzados en escritura y semántica de tiempo de eventos con marcas de agua para que las ventanas reflejen la verdad del negocio y no el orden de llegada. Sobre esa espina dorsal corren procesadores de flujos con estado que mantienen un estado local duradero, manejan la contrapresión de forma predecible, unen flujos calientes a referencias frías data, y emiten decisiones en lugar de meras filas transformadas. Para soportar la inspección y la justificación tanto por parte de los humanos como de los agentes, coloque una capa analítica en tiempo real que ingiera directamente del registro y responda a consultas de sub-segundos sobre tablas en continua actualización.

La vía caliente y la vía fría deben vivir en el mismo tejido. Aterriza los flujos en formatos de tablas abiertas con transacciones ACID y viajes en el tiempo, de modo que replays, los backfills, las auditorías y la formación puedan proceder sin congelar la tubería. Esto colapsa la falsa elección entre rápido y efímero por un lado y duradero y lento por el otro. La disciplina operativa cierra el círculo. Defina presupuestos de tardanza y reglas de retracción, documente los libros de ejecución replay y de letra muerta, y utilice despliegues canarios con tráfico duplicado para que los despliegues sean reversibles. Cuando estas prácticas están presentes, los agentes de fraude pueden bloquear antes de la liquidación, la personalización puede adaptarse en sesión, los agentes de fiabilidad pueden programar el mantenimiento cuando aparece la desviación por primera vez y los agentes de servicio pueden escalar cuando aumenta la frustración y no después del churn.

La gobernanza como sistema de ejecución

A medida que aumenta la autonomía, la confianza se convierte en la puerta de entrada. La documentación y las auditorías periódicas no evitan las malas decisiones; el control en tiempo de ejecución, sí. Dos medidas establecen ese control. En primer lugar, hacer cumplir los contratos data en la escritura, de modo que los productores publiquen los esquemas, la semántica y los objetivos de frescura, el registro bloquee los cambios incompatibles o los enrute a la cuarentena, los consumidores declaren las expectativas y los incidentes se planteen automáticamente cuando se incumplan las expectativas, de modo que los permisos de los agentes se reduzcan hasta que se recuperen las condiciones. En segundo lugar, evalúe la política como código en cada acción, ya sea desencadenada por un humano o por un agente. Cuando se solicita una herramienta o un conjunto de data, un motor de políticas debe evaluar quién llama, con qué propósito, sobre qué data, bajo qué riesgo y con qué obligaciones, por ejemplo, adjuntar un conjunto de pruebas, redactar campos sensibles o exigir una cofirma humana por encima de un umbral. El resultado debe ser una decisión firmada y un rastro auditable.

La seguridad necesita una postura de confianza cero que asuma el incumplimiento y verifique cada llamada. El mínimo privilegio, la verificación continua, la ejecución de herramientas en sandbox y el control estricto de la salida son apuestas sobre la mesa, mientras que los riesgos específicos de los agentes como la inyección puntual, el envenenamiento de recuperación y el abuso de herramientas requieren telemetría y contención en tiempo de ejecución en lugar de un ajuste centrado únicamente en el modelo. Lo que está en juego está claro en la misma investigación de Salesforce: sólo 43% de los líderes informan de marcos de gobernanza formales, 89% de los equipos que ya utilizan IA han experimentado resultados inexactos o engañosos y 88% afirman que la IA exige nuevos enfoques de gobernanza y seguridad. Una gobernanza probada significa que la plataforma puede mostrar quién actuó, con qué data, bajo qué política, utilizando qué modelo o versión de herramienta, y cómo dar marcha atrás en caso necesario, que es lo que separa a los pilotos que impresionan de los sistemas que sobreviven a las auditorías.

Cómo convergen los tres elementos

El anteproyecto es un sistema vivo que conecta a los productores, el almacenamiento, la informática y las políticas sin traspasos que erosionen la confianza. Los productores emiten eventos de cambio y depositan artefactos como PDF, imágenes, audio y vídeo en el almacenamiento en trozos, mientras que un catálogo global registra los activos, la propiedad, el linaje y las políticas aplicables. Los conductos cercanos a data normalizan, redactan, incrustan y alinean, y las características e incrustaciones resultantes fluyen hacia almacenes indexados con perfiles de recuperación documentados. Los procesadores de flujo con estado enriquecen y deciden en movimiento, y una superficie analítica en tiempo real expone los hechos frescos a los humanos y a los agentes. Paralelamente, los mismos hechos se escalonan en tablas de lago abierto con semántica ACID y viaje en el tiempo, de modo que las vistas en tiempo real y las históricas viven en un mismo sustrato gobernado. Los agentes interactúan a través de herramientas estrechas de mínimo privilegio; cada llamada se comprueba mediante políticas, y cada acción se firma y vincula a un linaje. Este patrón aborda las lagunas de confianza, puntualidad y accesibilidad que bloquean la escala.

Conclusión

Las empresas que pretendan ampliar la IA deben resistirse a la tentación de atornillar funciones de agente a una pila de la era de los cuadros de mando. Primero deben cambiar los cimientos. Convierta la multimodalidad en el valor predeterminado para que todas las señales útiles se sitúen bajo un catálogo con identidad, tiempo y linaje compartidos, y para que la recuperación devuelva pruebas en lugar de fragmentos. Haga del streaming el modo operativo para que las decisiones respeten el tiempo de los eventos y lleguen dentro de un presupuesto de latencia definido, mientras que los mismos flujos aterrizan en tablas abiertas para auditoría y aprendizaje. Actualice la gobernanza de las diapositivas al tiempo de ejecución haciendo cumplir los contratos en la escritura, evaluando las políticas en cada acción, aplicando la Confianza Cero a las herramientas y al data, y observando continuamente para que la autonomía se ponga en pausa o se rebaje cuando la calidad decaiga. En conjunto, estos movimientos sustituyen un sustrato de información por un sustrato de acción. Los agentes operan entonces con pruebas multimodales frescas dentro de guardarraíles explícitos, con explicaciones incorporadas, que es como los pilotos se convierten en producción y como la IA compone valor en lugar de excepciones.