Introducción
Desde su explosiva aparición a mediados de 2022, la IA generativa ha captado rápidamente la atención mundial. Lo que inicialmente se centró en la modalidad lingüística se ha expandido desde entonces a nuevas y apasionantes vías, incluidos los modelos de imagen, audio y vídeo. A principios de 2023, crecieron las especulaciones sobre el impacto potencial de la tecnología en las empresas de diversos sectores, acompañadas de emocionantes casos de adopción temprana. A medida que más desarrolladores empezaron a construir soluciones con estos modelos, la percepción general cambió hacia la aparición continua de versiones más nuevas, más grandes y, con suerte, mejores de los modelos más utilizados.
A medida que nos adentramos en 2024, ha surgido una idea clave: desplegar la IA no consiste simplemente en adoptar el modelo más reciente y más grande de la estantería. Aunque es habitual suponer que las soluciones de IA ya están hechas o que aumentar el tamaño del modelo conduce automáticamente a mejores resultados, este enfoque rara vez satisface las necesidades especializadas de la mayoría de las empresas. En realidad, las aplicaciones de éxito requieren soluciones de IA a medida, flexibles y eficaces.
Para lograrlo, recurrimos a Sistemas compuestos de IA. A diferencia de los modelos únicos y monolíticos, los sistemas compuestos de IA integran múltiples componentes especializados de IA, cada uno optimizado para una función específica. Esta estructura garantiza una gran personalización, adaptabilidad y precisión, transformando la IA de una herramienta general en una solución creada a medida. Combinando componentes de IA más pequeños e interconectados, las empresas pueden lograr un rendimiento y unos resultados que superan con creces el alcance de los modelos estándar por sí solos. Por lo tanto, para lograr un impacto empresarial óptimo en todos los sectores, sostenemos que una visión estratégica debería priorizar los diseños de sistemas más inteligentes frente a la mera construcción de modelos más grandes y exigentes desde el punto de vista computacional.
Comprender los sistemas de IA compuestos
El laboratorio de Investigación de Inteligencia Artificial de Berkeley (BAIR) define un sistema compuesto de IA como un sistema “que aborda tareas de IA utilizando múltiples componentes que interactúan, incluyendo múltiples llamadas a modelos, recuperadores o herramientas externas”. Por ejemplo, Sistema de Generación Aumentada de Recuperación (RAG) es un sistema compuesto que combina un gran modelo lingüístico (LLM), un mecanismo de recuperación de información y una base data vectorizada. En cambio, un modelo generativo de IA es un modelo estadístico; por ejemplo, un LLM predice el siguiente token en el texto basándose en el entrenamiento data.
En este contexto, un modelo puede verse como un bloque único, mientras que un sistema compuesto de IA se parece más a una máquina compuesta por múltiples bloques de construcción, cada uno de los cuales cumple una función específica para lograr el objetivo general del sistema.

Modelos frente a sistemas compuestos de IA. Fuente
¿En qué son útiles estos sistemas?
La especialización: Un gran martillo no es la herramienta adecuada para todo
Cuando se abordan aplicaciones específicas o necesidades de la industria, confiar en un modelo de IA de propósito general como el GPT-4 puede no ser suficiente. Aunque potentes, estos modelos están diseñados para manejar una amplia gama de tareas y pueden carecer de los conocimientos especializados necesarios para aplicaciones concretas, lo que conduce a rendimientos decrecientes a partir de cierto punto.
Por ejemplo, una institución financiera que quiera desarrollar un chatbot para el análisis de inversiones o la gestión de patrimonios necesita un sistema que incorpore tanto conocimientos especializados como experiencia específica de la empresa. Dada la naturaleza de la industria, habría preocupaciones en torno a la privacidad (la empresa puede requerir soluciones in situ y el uso exclusivo de modelos abiertos), la precisión (las soluciones deben ser impecablemente precisas) y la eficiencia. Utilizar incluso los modelos lingüísticos más potentes como solución independiente no sería, desde luego, la opción óptima. En su lugar, un sistema de IA compuesto podría ser muy eficaz integrando múltiples componentes especializados, como los sistemas de generación mejorada por recuperación (RAG) y los agentes de IA a medida. Este enfoque garantiza que cada parte del sistema esté optimizada para su función específica.
Flexibilidad: Los sistemas modulares se adaptan a las necesidades cambiantes con facilidad
Cuando un sistema se construye utilizando componentes modulares, sustituir o actualizar las piezas individuales resulta mucho más sencillo. El mismo principio se aplica a los sistemas compuestos de IA, que se construyen a partir de múltiples bloques. Si un componente de una solución de IA compuesta se queda obsoleto o no cumple los nuevos requisitos de conformidad, puede sustituirse sin necesidad de revisar todo el sistema. Por ejemplo, si aparece un nuevo modelo más adecuado, puede integrarse en el sistema para sustituir a la versión anterior. Del mismo modo, si se desarrolla un mecanismo de recuperación de la información más eficaz, puede intercambiarse sin interrumpir toda la configuración. Esta flexibilidad se extiende más allá de los modelos y los sistemas de recuperación a otros componentes, como las unidades de procesamiento data, los motores de análisis o los módulos de conformidad.
Escalabilidad: Los enjambres de componentes inteligentes superan a un único gigante
La naturaleza modular de los sistemas de IA compuestos ofrece ventajas significativas en cuanto a escalabilidad. Al permitir que los componentes individuales se escalen de forma independiente, estos sistemas pueden gestionar eficazmente volúmenes y complejidades cada vez mayores data sin necesidad de una revisión completa.
Un sistema puede escalarse replicándolo en una red de sistemas, lo que teóricamente permite una escalabilidad infinita. Esta es la razón por la que un único modelo lingüístico, por muy grande o potente que sea (a día de hoy), no puede buscar eficazmente una información específica en una base data muy grande. Para ampliar las capacidades de búsqueda de un modelo, inevitablemente tendrá que crear un sistema multicomponente que mejore la función de búsqueda. Si ni siquiera las tareas más sencillas, como la recuperación de información, pueden ser escaladas eficazmente por un único modelo, queda claro que los componentes individuales, por sí solos, no pueden soportar aplicaciones complejas a gran escala.
Por qué los sistemas de IA compuestos tienen sentido desde el punto de vista empresarial
Desde una perspectiva empresarial, la adopción de sistemas compuestos de IA va más allá de la sofisticación técnica: proporciona ventajas estratégicas que se alinean directamente con los objetivos empresariales. Incluso se podría argumentar que si una empresa desea aprovechar la IA generativa, no tiene más remedio que construir (o comprar) un sistema compuesto. Aunque esto pueda parecer sencillo, pone en tela de juicio la suposición empresarial común de que los modelos independientes y listos para usar son suficientes para satisfacer las demandas especializadas.
Mayor satisfacción del cliente
Los modelos de IA más avanzados, por sí solos, no pueden crear una experiencia personalizada. Esto sólo puede lograrse mediante un sistema compuesto que permita ofrecer experiencias al cliente altamente personalizadas y contextualmente relevantes. Por ejemplo, la Voz neural personalizada combina los LLM generales con un entrenamiento de voz personalizado, lo que permite a las marcas crear asistentes digitales que se ajusten con precisión a su tono y estilo únicos. Este nivel de personalización es particularmente poderoso en las industrias orientadas al cliente, como la publicidad, donde los clientes responden positivamente al sentirse especiales y comprendidos. Desde una perspectiva empresarial, la combinación de esta tecnología con la capacidad de añadir contexto da lugar a resultados personalizados, lo que en última instancia impulsa la satisfacción del cliente.
Eficiencia de costos
A diferencia de los modelos individuales que proporcionan un nivel fijo de calidad a un coste fijo, la IA compuesta ofrece configuraciones flexibles de coste-calidad. Por ejemplo, las empresas pueden integrar un modelo más pequeño, ajustado a las instrucciones, con componentes especializados, como la heurística de búsqueda, para obtener resultados de alta calidad a un coste inferior en comparación con modelos más grandes e independientes. Esta flexibilidad permite utilizar modelos más pequeños, potencialmente de código abierto, que, con una ingeniería específica, pueden ofrecer resultados comparables a soluciones más caras.
Mejor control y confianza
Para las empresas, la fiabilidad y la confianza en los resultados de la IA son cruciales. Confiar únicamente en modelos individuales puede dificultar la obtención de resultados coherentes y bien formateados. Por ejemplo, un cliente anterior del sector educativo me pidió una vez una solución para rellenar automáticamente las solicitudes basándose en su data e información escolar. Al principio, pasé meses elaborando un sistema secuencial basado en la ingeniería avanzada de solicitudes, sin utilizar un enfoque compuesto. Los resultados mejoraron, pero nunca se acercaron lo suficiente a lo que podíamos presentar como solicitudes totalmente cumplimentadas. Sólo cuando se introdujo el concepto de GAR empezaron a surgir resultados totalmente controlados. Sin embargo, ni siquiera la GAR por sí sola era suficiente; se necesitaban componentes adicionales para categorizar la información, mantener la coherencia del contexto y manejar otros matices. Sólo entonces conseguimos la fiabilidad y precisión que el cliente necesitaba.
Conclusión
El examen del panorama actual de la IA en las aplicaciones industriales revela una tendencia clara: confiar en un único modelo para realizar funciones complejas suele resultar poco fiable. A medida que los casos de uso se hacen más intrincados y crece la adopción por parte de las empresas, la demanda de soluciones de IA altamente especializadas y capaces está llamada a aumentar. Para satisfacer esta demanda, hay que orquestar una arquitectura de soluciones que incorpore modelos mejorados y especializados, evitando el escollo de tener un alcance estrecho y unilateral.
La comunidad de desarrolladores bulle con aplicaciones apasionantes que abarcan campos que van desde la medicina hasta el comercio minorista, todas ellas construidas ensamblando componentes más pequeños y especializados en soluciones potentes y a medida.
Incluso la IA, por sí sola, no es lo suficientemente inteligente para alcanzar los objetivos empresariales estratégicos. Debe complementarse con una forma superior de inteligencia orquestada.
Apéndice
Ejemplos de sistemas compuestos de IA
A continuación presentamos una colección de sistemas compuestos de IA impactantes e interesantes que ponen de manifiesto la utilidad de este concepto. Independientemente de la infraestructura que utilicen los desarrolladores, el objetivo es observar cómo la combinación de varios componentes de IA con otras herramientas puede lograr un propósito muy específico.
RAG mejora la salida de un LLM proporcionando un contexto específico obtenido de una base data vectorizada que se encuentra fuera del data de entrenamiento original del modelo. Mientras que los LLM se entrenan en vastos conjuntos de data y aprovechan miles de millones de parámetros para generar respuestas, el RAG va un paso más allá. Permite al LLM acceder y referenciar información específica y actualizada, ya sea específica del dominio o extraída de la base de conocimientos interna de una organización. Este proceso mejora significativamente la relevancia, precisión y utilidad del contenido generado, todo ello sin necesidad de volver a entrenar el modelo.
Las empresas con grandes conjuntos de data que necesitan un método eficaz para organizar el conocimiento interno pueden desplegar esta solución in situ, utilizando el modelo de su elección, para recuperar piezas precisas de información. Por ejemplo, los analistas financieros pueden localizar rápidamente data relevantes dentro de reports históricos sin necesidad de cribar manualmente cada uno de ellos. El modelo, mejorado por esta información contextual, también genera respuestas más precisas y útiles, agilizando todo el proceso de recuperación de información.
A continuación se muestra una arquitectura RAG típica:

Arquitectura general RAG
La siguiente es una tabla de algunos sistemas de IA compuestos comunes (fuente):


BLOG






