La adopción por parte de los consumidores también sigue siendo relativamente baja. A pesar del uso de palabras como “revolución”.” data muestra que la mayoría de los usuarios tocan semanalmente y no a diario, a diferencia del uso más frecuente de las redes sociales o plataformas como Google. Esto sugiere que la gen AI aún no se ha convertido en un verdadero hábito de consumo. La gente la utiliza ocasionalmente -a veces intensamente- pero no se ha convertido en un pilar de la vida cotidiana. El bombo publicitario, en otras palabras, todavía va por delante de la realidad.
A pesar de estos reports, creemos que la IA genérica representa un cambio fundamental a la misma escala que internet o el smartphone. Internet nos proporcionó aproximadamente dos décadas de innovación y creación de empresas. La revolución de los smartphones creó 15 años de crecimiento impulsado por las aplicaciones móviles. Creemos que la IA de gen impulsará una era de transformación similar, quizá una década o más de nueva creación de valor.
Este patrón es común con las nuevas tecnologías (el optimismo excesivo seguido por la desilusión y luego la creación de valor real, a menudo articulada a través de el ciclo hype de Gartner). En nuestra opinión, muchos de los principales defensores de la IA exageran cuando hacen declaraciones audaces de que franjas enteras de la economía serán sustituidas en breve por la IA. Esto se debe a que la IA real y funcional en las empresas establecidas es un trabajo duro: requiere un data relativamente limpio, un mapeo de procesos y una experimentación profunda, e incluso entonces a menudo requiere un humano en el bucle. Sin embargo, estamos viendo progresos reales, entre bastidores, cuyos ejemplos sugieren que el uso de sistemas multiagente para automatizar y sustituir tareas repetitivas puede conducir a una rampa de productividad más larga y fundacional.
Nuestra opinión es que los líderes no deberían intentar adivinar lo que va a ocurrir dentro de 10 años. En su lugar, deberían preguntarse qué pueden conseguir de forma realista en los próximos dos. Basándonos en los proyectos que hemos realizado desde finales de 2024, la IA agéntica está demostrando ser el verdadero cambio de juego (al menos a corto plazo), aportando un valor real a las empresas. La realidad es también que las ganancias financieras por proyecto son buenas, pero ninguna de ellas es asombrosa. Estas ganancias incrementales se asemejan aquí a Lean, una comparación que el director general de Microsoft Satya Nadella también ha hecho.
Basándonos en nuestro trabajo en una cartera de proyectos que están implementando con éxito sistemas de IA agéntica, hemos descubierto que para tener éxito con esta tecnología es necesario cortar por lo sano, entender lo que la tecnología puede hacer en, y hacer coincidir esa capacidad con oportunidades claras de creación de valor. También requiere un enfoque práctico para experimentar y aprender la implementación de sistemas multiagente.
El auge del paradigma del flujo de trabajo agenético
En los últimos años se ha visto cómo la madurez de la tecnología de la IA evolucionaba rápidamente a través de al menos tres fases distintas:
- Prompting (2022): El entusiasmo inicial se centró en los “power prompts”. En las pruebas de concepto (POC), las indicaciones parecían funcionar. Pero en producción, la fiabilidad cayó rápidamente. Los procesos empresariales suelen requerir una precisión de 95-99%. Basándonos en la experiencia de más de 50 casos, suponemos que los avisos por sí solos rara vez superan los 70%.
- Generación Recuperada-Aumentada (RAG, 2023): RAG mejoró la estabilidad anclando las salidas de la IA genérica a las bases de conocimiento. De nuevo, los POC parecían prometedores, pero la complejidad de la producción expuso a menudo puntos débiles que conducían a una precisión inaceptablemente baja.
- Sistemas agénticos (2024 hasta la actualidad): Los avances más recientes implican redes de pequeños agentes especializados. Algunos enrutan preguntas. Otros realizan tareas estrechamente definidas. Y otros comprueban y corrigen los resultados. Fundamentalmente, la caída de los costes de las fichas hace que los sistemas multiagente en cascada sean ahora comercialmente viables. Este diseño en capas mejora significativamente la fiabilidad.
Este otoño se ha producido una explosión de iniciativas comerciales de agentic. OpenAI lanzó asociaciones con Stripe y Shopify. Google anunció su protocolo de pago por agente, que automatiza el proceso de compra y transacción. Aunque las empresas pueden sentirse tentadas a seguir el ejemplo de los gigantes tecnológicos, puede que no sea aquí donde surja la primera oleada de valor sostenible. En un reciente encuesta de Bain entre consumidores, 76% informaron de que no se sentirían cómodos utilizando sistemas de agenciamiento para las compras; la mayoría citó la preocupación por la seguridad y la privacidad como motivo de su reticencia.
Los contextos de cara al cliente encajan mal con las capacidades actuales de los agentes de IA. Son desordenados e impredecibles; las entradas no están estructuradas, el tono y el contexto cambian constantemente, y los reguladores y los consumidores tienen poca tolerancia a las alucinaciones o los errores. Sistemas multiagente puede alcanzar altos niveles de precisión, pero hacerlo requiere tratar a cada agente individual más bien como a un niño pequeño. Usted no le pediría a un niño pequeño que pusiera la mesa para cenar. Pero si divide la tarea y le guía paso a paso - “primero, pon un plato”, “ahora, añade los tenedores”, “después, los vasos”-, el niño pequeño puede hacer una contribución significativa. Crucialmente, el entorno también debe estar controlado: sin hermanos ruidosos, sin mascotas que distraigan, y sólo uno de los padres dando instrucciones. Pero al desarrollar sistemas multiagente estructurados como se instruye a un niño pequeño -dividiendo la tarea, dando las tareas una a una, comprobando la precisión de las tareas- estamos construyendo sistemas notablemente precisos.
En particular, estos sistemas son a menudo para los procesos de back-end, donde la perfección no es esencial porque usted tiene un humano en el bucle. Por el contrario, aunque los experimentos de front-end pueden ser inspiradores, es poco probable que sean la primera área de creación de valor empresarial real. Los procesos operativos y de backend son terreno fértil porque son estructurados y repetitivos, mucho más adecuados para la automatización del flujo de trabajo agéntico. Tareas con un alcance muy ajustado, entornos bien definidos y entradas estructuradas pueden dar lugar a proyectos que realicen una contribución significativa.
Construir sistemas agenticos a nivel empresarial
A escala empresarial, el diseño de estos sistemas es conceptualmente sencillo pero operativamente exigente. Como marco general para construir sistemas multiagente, 1) se envía una tarea a un agente enrutador como Google ADK que, como un padre que da instrucciones a un niño pequeño, divide la tarea en subtareas; 2) las subtareas son completadas entonces por agentes de tareas individuales que completan una parte más pequeña de la tarea, como el padre que dice a un niño pequeño que ponga las gafas en la mesa y a otro que ponga los tenedores; después de lo cual 3) los resultados de estas subtareas son comprobados por un agente de validación; y 4) si se descubre un error, un agente de mejora recomienda un ajuste.
Un ecosistema de herramientas, metodologías y servicios en rápido crecimiento respalda este enfoque, y son excelentes para los procesos no esenciales. Pero cuando se pasa a las operaciones principales -donde la integridad data y el control sobre las alucinaciones son esenciales- se necesitan agentes codificados a medida, una integración más profunda con los sistemas de la empresa y un mejor control y guardarraíles implementados.
Un ejemplo de caso: Reinventar las operaciones sobre el terreno
Para ilustrarlo, consideremos un proyecto que realizamos con un importante proveedor de Internet europeo. Nuestro objetivo era reducir tanto el tiempo de resolución como el coste de las llamadas al servicio de asistencia técnica para su solución. La mayoría de la gente ha experimentado la experiencia de llamar a un servicio de asistencia por una conexión averiada, repetir la información varias veces y, finalmente, esperar a un técnico. Lo que ocurre (o deja de ocurrir) entre bastidores es revelador: los técnicos suelen llegar con un contexto incompleto, obligados a solucionar los problemas desde cero. Esto da lugar a largos periodos de inactividad -a veces de más de un mes- y a miles de horas de operador malgastadas.
Decidimos empezar poco a poco. Nos centramos en construir un sistema centrado en ayudar a los técnicos a hacer sus tareas más rápido y mejor: un ayudante en el proceso, no un agente independiente. Como parte de este esfuerzo, integramos data de más de 15 sistemas de información, proporcionando a los técnicos un resumen de los fallos comunicados y un historial de las soluciones que se habían probado. Esto les proporcionaba una visión general de la tarea -por ejemplo, la solución de problemas de conexión de un cliente- que podían leer o escuchar de camino al trabajo. Así podían empezar a trabajar para solucionarlo en cuanto llegaban, ahorrando tiempo que a menudo se perdía poniéndose al día sobre el problema.
A continuación, creamos una función que generaba recomendaciones sobre la siguiente acción más adecuada para la resolución. Otra función incluía una interfaz conversacional que permitía al técnico consultar los sistemas informáticos subyacentes de la empresa de Internet en lenguaje natural para encontrar las causas raíz. Por último, automatizamos muchas acciones sencillas y repetitivas: por ejemplo, la corrección de los registros de CRM cuando se vinculaba el hogar equivocado o la activación de reinicios de la red cuando se averiaba un interruptor en la caja del conector central del barrio. Esto ahorró al técnico una inmensa cantidad de tiempo, ya que no tuvo que llamar al centro de llamadas interno para que le ayudaran con pequeños cambios a realizar la corrección.
A lo largo de ocho meses, trabajamos de forma iterativa, trazando procesos, solucionando los puntos débiles y añadiendo funcionalidad paso a paso, con los comentarios semanales de los técnicos de campo que probaban la solución basada en tabletas.
Los resultados:
- 60% reducción del tiempo de resolución
- Más de un millón de euros ahorrados anualmente de forma recurrente
- Mejora significativa de la clientela puntuación neta del promotor
Basándose en estos resultados, el cliente quería que se ampliara a siete regiones más. Esto requirió bastante más trabajo: La metodología y algunos componentes del agente eran reutilizables, pero cada región tenía sistemas informáticos diferentes. Cada despliegue requería nuevas integraciones y mapeos data. La ampliación a cada una de las siete regiones requirió la mitad del esfuerzo original de una por región añadida.
Los retos de la implantación de sistemas multiagente
Como se ha ilustrado anteriormente, las implantaciones de sistemas multiagente pueden crear valor real con éxito, pero muy poca gente habla del trabajo real que supone ponerlos en práctica. ¿Cuáles fueron las realidades y los obstáculos a los que nos enfrentamos?
Probar rápido frente a ampliar.
¿Lo construimos desde el principio con una bonita arquitectura escalable? Por mucho que quisiéramos afirmarlo, habría sido imposible. Al igual que los innovadores descubren de forma iterativa el ajuste producto-mercado, los casos de uso del sistema multiagente y la solución evolucionaron de forma iterativa a medida que participábamos en un ciclo de experimentación rápida. Junto a esto, la tecnología, la metodología y los servicios para construir estos sistemas evolucionaron rápidamente.
No empezamos con el sistema completo. En su lugar, empezamos con un LLM más RAG como pieza central para resolver básicamente el primer caso de uso. A medida que probábamos, aprendimos que necesitábamos dividir el sistema en agentes más pequeños que realizaran tareas más especializadas para aumentar la fiabilidad; poco a poco, esto evolucionó hasta convertirse en un sistema totalmente agéntico. Finalmente, desarrollamos un sistema altamente fiable y funcional que aporta valor. Con estos conocimientos y los resultados que tenemos ahora, lo estamos reconstruyendo en una arquitectura que es mucho más robusta para escalar otras partes de la empresa y que puede mantenerse más fácilmente.
Zonas problemáticas frente a causas profundas.
Como regla general, descubrimos que los líderes y los mandos intermedios saben aproximadamente qué procesos requieren mucho tiempo o esfuerzo, pero tienen opiniones mal informadas sobre dónde está la complejidad y la oportunidad. Sólo los operarios lo saben. La implicación es que hay que hacer dos cosas antes de empezar a construir de verdad: 1) dedicar el tiempo suficiente a comprender los problemas desde la perspectiva de los gestores, pero también 2) hablar con los operarios sobre lo que entienden como la causa raíz de cualquier problema dado.
Por ejemplo, los gestores nos señalaban partes del proceso en las que se perdía tiempo o recursos (por ejemplo, en el centro de servicios compartidos) y nos decían que buscáramos los “elementos de conocimiento” adecuados para que el operario resolviera más rápidamente un problema. Sin embargo, cuando empezamos a trabajar directamente con los operadores, descubrimos que la mitad de ellos encontraban los “elementos de conocimiento” en 10 segundos, mientras que la otra mitad tardaba minutos en encontrar la misma información porque no se les daba bien buscar en el sistema. Éste no es un problema que la IA agéntica pueda resolver bien: es una cuestión de formación. Pero también descubrimos que los líderes y los gerentes habían pasado por alto completamente que los operadores dedican aproximadamente el 50% de su tiempo a rellenar el CRM después de las llamadas de los clientes. Este es un buen problema para un agente, que puede transcribir la llamada y poner toda la información en los campos correctos, acelerando enormemente el proceso y mejorando data la calidad. El operador sólo tiene que comprobar y pulsar OK.
Los sistemas informáticos no le ralentizan: lo hacen las personas.
Las partes más laboriosas y complejas de nuestro trabajo fueron entrar en las discusiones de gestión adecuadas, ganarnos a las partes interesadas e identificar y resolver las dependencias que se produjeron a causa de nuestro trabajo. Integrarse con una docena de sistemas informáticos para que la solución funcione es complejo desde el punto de vista tecnológico, pero el verdadero reto es que todos estos sistemas tienen sus propios equipos de desarrollo con diferentes plazos, prioridades y hojas de ruta. Hacer que los puntos finales de la API estén disponibles y probarlos hasta el final puede suponer dos semanas de trabajo. Entrar en las respectivas hojas de ruta de estos sistemas llevó mucho, mucho más tiempo. La mayoría de los equipos con los que nos coordinábamos quitaron prioridad a este trabajo durante varios meses, alegando (probablemente con validez desde su punto de vista) que tenían trabajo más importante que era prioritario.
Las modelos pueden alucinar y lo harán.
Los agentes siguen siendo bastante inestables y pueden alucinar, por lo que se necesitan fuertes guardarraíles y comprobaciones en forma de LLM-como-un-juez (el agente de validación). El sistema indicador del agente tiene que ser lo suficientemente fuerte y a la vez ligero para que el agente ejecute las tareas correctamente. Esto requiere matices, tiempo y conocimientos científicos y de ingeniería data para hacer que estos sistemas agénticos funcionen con una fiabilidad lo suficientemente alta como para permitir que funcionen en su empresa. En otras palabras, los buenos desarrolladores y la experiencia en los negocios siguen siendo muy relevantes.
La nueva disciplina de la transformación agéntica
¿Qué lecciones más generales podemos extraer del caso? En muchos sentidos, es como redescubrir el trabajo de Lean-reengineering desde cero. La diferencia es que el conjunto de herramientas de hoy en día es mucho más potente y permite no sólo una optimización incremental, sino un rediseño completo de los procesos, incluso en todos los departamentos.
Más allá del data y de las capacidades de la IA, el éxito depende de un profundo conocimiento de los procesos: comprender el estado actual, prever el estado futuro y traducirlo en pequeños pasos construibles. En ese sentido, estamos asistiendo al regreso de “Cinturones negros Lean,” pero esta vez, están impulsados por gen AI.
El trabajo es minucioso y metódico, no glamuroso. Hay que ir paso a paso. El enfoque escala en método, no en magia. Cada nueva área de negocio requiere un nuevo análisis y una adaptación personalizada.
Los agentes totalmente autónomos siguen estando muy lejos. Por ahora, la configuración más eficaz mantiene a un humano en el bucle, haciendo que el operador sea más inteligente, más rápido y esté mejor equipado.
El progreso es incremental al principio. Sólo cuando los sistemas centrales se conectan y la información fluye sin problemas aparecen importantes mejoras de la eficiencia.
La tecnología también evoluciona más rápido que los proyectos. Las herramientas que utilizábamos hace ocho meses ya están anticuadas. Por eso nos centramos en casos de uso con amortización en el plazo de un año, antes de que cambie la tecnología subyacente.
Y lo que es más importante, las empresas deben crear capacidades internas: ingenieros data, científicos data, diseñadores UX de gen AI y lo que algunos llaman ahora ingenieros de contexto o cinturones negros de gen AI: personas que comprendan profundamente los procesos y puedan descomponer la transformación en pasos alcanzables. La creación de estas capacidades como empresa le permitirá construir nuevos flujos de trabajo agénticos con mayor rapidez (a medida que evolucione la tecnología), lo que puede suponer un verdadero factor diferenciador frente a la competencia.
Por último, aunque estas iniciativas acabarán integrándose en las operaciones empresariales normales, es esencial ponerlas en marcha con una gobernanza sólida, que aúne las perspectivas técnicas y empresariales. Ese equilibrio es lo que convierte la experimentación en transformación.
La década que viene
Puede que el bombo publicitario de la IA Gen haya superado a su adopción, pero su potencial es real. Al igual que las revoluciones de Internet y de los teléfonos inteligentes, este cambio de plataforma reconfigurará las industrias, no de la noche a la mañana, sino a lo largo de años de reinvención disciplinada.
Las organizaciones que triunfen no se limitarán a adoptar herramientas, sino que desarrollarán la capacidad de reinventarse continuamente a través de ellas.

BLOG










