Tres aspectos innegociables antes de actualizar la pila de data a una pila de AI
La mayoría de las empresas no están preparadas para sustituir una pila de data de la era de los cuadros de mando por una pila de AI . El último informe State of Data & Analytics de Salesforce indica que el 84 % de los responsables de data y análisis afirman que sus estrategias requieren una revisión completa antes de que las ambiciones de AI puedan tener éxito. Los líderes estiman que el 26% de sus data no son fiables, sólo el 43% dispone de marcos formales de gobernanza de data y alrededor del 50% no confía en su capacidad para generar y ofrecer información oportuna. Al mismo tiempo, el 70% cree que data no estructurados encierran la información más valiosa. La conclusión es sencilla: el obstáculo no es el entusiasmo, sino la base, y esa base debe cambiar antes de que los sistemas agénticos puedan escalar.
La AI agenética convierte las plataformas de data en sistemas de acción que leen contratos y tickets, vigilan cámaras, escuchan llamadas, correlacionan con registros y eventos y luego ejecutan. Los cuadros de mando pueden tolerar retrasos, mientras que los agentes no; la conformidad puede operar mediante documentación, pero los agentes requieren controles en tiempo de ejecución. Antes de que cualquier empresa proclame una pila de AI , tres elementos deben ser innegociables: la multimodalidad por defecto, el streaming como modo operativo y la gobernanza como sistema en tiempo de ejecución. Las secciones siguientes traducen estas convicciones en opciones arquitectónicas que soportan cargas de trabajo de agentes a escala de producción.
Multimodal por defecto
Tratar documentos, imágenes, audio, vídeo y registros como activos de segunda clase limita la capacidad de los agentes por diseño. Una plataforma adecuada para agentes almacena tablas y tensores como pares bajo un catálogo con un sistema de linaje unificado y un modelo de acceso coherente, de modo que los medios de alta dimensión puedan moverse a través del mismo ciclo de vida que data relacionales. En la práctica, esto significa diseños en mosaico o en trozos que permitan lecturas parciales y la extracción de regiones de interés; identificadores de contenido con metadatos laterales versionados para que cada artefacto sea reproducible; y formatos nativos de matrices y columnas que permitan la introducción de predicados y coordenadas. El texto y los documentos requieren incrustaciones como derivado primario que se generen de forma determinista, se versionen con sus fuentes y se indexen con compensaciones claras, por ejemplo, HNSW cuando predomine el recuerdo, IVF PQ cuando deban equilibrarse la memoria y la latencia, e indexación híbrida densa más léxica cuando los códigos y números de producto sean esenciales. La recuperación debe devolver paquetes de pruebas, como pasajes, páginas, fotogramas o clips, ya que los agentes razonan sobre las pruebas y no sobre subcadenas aisladas.
Los mayores beneficios proceden de la fusión, pero ésta sólo es valiosa cuando la alineación se resuelve a nivel de plataforma. La fusión temprana capta las interacciones finas, como la alineación de tramos de texto con regiones de imagen, la fusión tardía conserva los modelos específicos de cada modalidad hasta un límite de decisión, y los enfoques híbridos combinan ambos cuando los puntos de interacción están bien definidos. La alineación es la parte difícil. La sincronización temporal de eventos entre fuentes con diferentes frecuencias de muestreo, el registro espacial entre sensores y la vinculación semántica para que un ID de pedido en un PDF, un fotograma de cámara de carril tres, un pico de vibración y un evento de libro mayor se resuelvan en el mismo objeto empresarial son capacidades que pertenecen a la capa de catálogo y linaje. Sin esta noción compartida de tiempo, identidad y procedencia, los agentes alucinarán con el contexto o actuarán sobre señales obsoletas. Dado que el 70% de los directivos creen que los conocimientos más valiosos se encuentran en data no estructurados, la multimodalidad no puede ser un complemento de la segunda fase. Es el valor por defecto que desbloquea el contexto.
Streaming como modo de funcionamiento
El trabajo agenético introduce un objetivo central a nivel de servicio: la latencia de decisión, el tiempo que transcurre entre una señal del mundo real y una acción aceptable. Para alcanzar este objetivo se requiere una plataforma de streaming. La espina dorsal es un registro de eventos que actúa como sistema de registro, con esquemas forzados en escritura y semántica de tiempo de eventos con marcas de agua para que las ventanas reflejen la verdad del negocio en lugar del orden de llegada. En esa columna vertebral se ejecutan procesadores de flujos con estado que mantienen un estado local duradero, gestionan la contrapresión de forma predecible, unen flujos calientes a data referencia fríos y emiten decisiones en lugar de meras filas transformadas. Para facilitar la inspección y la justificación tanto por parte de los humanos como de los agentes, coloque una capa analítica en tiempo real que ingiera directamente desde el registro y responda a consultas de menos de un segundo sobre tablas que se actualizan continuamente.
La ruta caliente y la ruta fría deben vivir en el mismo tejido. Aterriza los flujos en formatos de tabla abiertos con transacciones ACID y viajes en el tiempo, de modo que Repeticiones, los backfills, las auditorías y la formación puedan proceder sin congelar la tubería. Esto derrumba la falsa elección entre rápido y efímero por un lado y duradero y lento por otro. La disciplina operativa cierra el círculo. Defina presupuestos de retraso y reglas de retracción, documente los libros de ejecución de Repetición y letra muerta, y utilice despliegues canarios con tráfico duplicado para que los despliegues sean reversibles. Cuando estas prácticas están presentes, los agentes de fraude pueden bloquear antes de la liquidación, la personalización puede adaptarse en sesión, los agentes de fiabilidad pueden programar el mantenimiento cuando aparece la desviación por primera vez, y los agentes de servicio pueden escalar cuando aumenta la frustración en lugar de después de la rotación.
La gobernanza como sistema de ejecución
A medida que aumenta la autonomía, la confianza se convierte en la puerta de entrada. La documentación y las auditorías periódicas no evitan las malas decisiones; el control en tiempo de ejecución, sí. Dos medidas establecen ese control. En primer lugar, hacer cumplir los contratos de data en la escritura, de modo que los productores publiquen esquemas, semántica y objetivos de frescura, el registro bloquee los cambios incompatibles o los envíe a cuarentena, los consumidores declaren sus expectativas y se produzcan incidentes automáticamente cuando se incumplan las expectativas, de modo que los permisos de los agentes se reduzcan hasta que se recuperen las condiciones. En segundo lugar, evalúe la política como código en cada acción, ya sea desencadenada por un humano o por un agente. Cuando se solicita una herramienta o un conjunto de datos, un motor de políticas debe evaluar quién llama, con qué propósito, sobre qué data, bajo qué riesgo y con qué obligaciones, por ejemplo, adjuntar un paquete de pruebas, redactar campos sensibles o exigir una cofirmación humana por encima de un umbral. El resultado debe ser una decisión firmada y un rastro auditable.
La seguridad necesita una postura de confianza cero que asuma el incumplimiento y verifique cada llamada. El mínimo privilegio, la verificación continua, la ejecución de herramientas en un entorno aislado y el control estricto de la salida son fundamentales, mientras que los riesgos específicos de los agentes, como la inyección puntual, el envenenamiento de la recuperación y el abuso de herramientas, requieren telemetría y contención en tiempo de ejecución en lugar de un ajuste centrado únicamente en el modelo. Lo que está en juego está claro en la misma investigación de Salesforce: sólo el 43% de los líderes informan de marcos de gobernanza formales, el 89% de los equipos que ya utilizan AI han experimentado resultados inexactos o engañosos y el 88% afirman que AI exige nuevos enfoques de gobernanza y seguridad. Una gobernanza probada significa que la plataforma puede mostrar quién actuó, con qué data, bajo qué política, utilizando qué modelo o versión de herramienta, y cómo dar marcha atrás en caso necesario, que es lo que separa a los pilotos que impresionan de los sistemas que sobreviven a las auditorías.
Cómo convergen los tres elementos
El proyecto es un sistema vivo que conecta productores, almacenamiento, informática y políticas sin transferencias que erosionen la confianza. Los productores emiten eventos de cambio y depositan artefactos como PDF, imágenes, audio y vídeo en el almacenamiento en trozos, mientras que un catálogo global registra los activos, la propiedad, el linaje y las políticas aplicables. Los canales de data cercanos normalizan, redactan, incrustan y alinean, y las características e incrustaciones resultantes fluyen hacia almacenes indexados con perfiles de recuperación documentados. Los procesadores de flujo de estado enriquecen y deciden en movimiento, y una superficie analítica en tiempo real expone los hechos frescos a los humanos y a los agentes. Paralelamente, los mismos hechos se estratifican en tablas de lago abiertas con semántica ACID y viaje en el tiempo, de modo que las vistas en tiempo real y las históricas viven en un mismo sustrato gobernado. Los agentes interactúan mediante herramientas de mínimos privilegios; cada llamada se comprueba mediante políticas, y cada acción se firma y vincula a un linaje. Este patrón aborda las lagunas de confianza, puntualidad y accesibilidad que bloquean la escalabilidad.
Conclusión
Las empresas que pretendan ampliar AI deben resistirse a la tentación de añadir funciones de agente a una pila de la era de los cuadros de mando. Primero deben cambiar los cimientos. Convierta la multimodalidad en el valor predeterminado, de modo que todas las señales útiles se incluyan en un catálogo con identidad, tiempo y linaje compartidos, y que la recuperación devuelva pruebas en lugar de fragmentos. Hacer del streaming el modo operativo para que las decisiones respeten el tiempo del evento y lleguen dentro de un presupuesto de latencia definido, mientras que los mismos flujos aterrizan en tablas abiertas para auditoría y aprendizaje. Actualizar la gobernanza de las diapositivas al tiempo de ejecución haciendo cumplir los contratos en la escritura, evaluando las políticas en cada acción, aplicando la confianza cero a las herramientas y los data, y observando continuamente para que la autonomía se ponga en pausa o se reduzca cuando baje la calidad. En conjunto, estas medidas sustituyen un sustrato de información por un sustrato de acción. Los agentes operan entonces con pruebas multimodales frescas dentro de barandillas explícitas, con explicaciones incorporadas, que es como los pilotos se convierten en producción y como AI compone valor en lugar de excepciones.

BLOG






