Introducción

Desde su explosiva aparición a mediados de 2022, la web generativa AI ha captado rápidamente la atención mundial. Lo que en un principio se centró en la modalidad lingüística se ha ampliado a nuevas e interesantes vías, como los modelos de imagen, audio y vídeo. A principios de 2023, crecieron las especulaciones sobre el impacto potencial de la tecnología en empresas de diversos sectores, acompañadas de interesantes casos de adopción temprana. A medida que más desarrolladores empezaron a crear soluciones con estos modelos, la percepción general cambió hacia la aparición continua de versiones más nuevas, más grandes y, con suerte, mejores de los modelos más utilizados.

A medida que nos adentramos en 2024, ha surgido una idea clave: la implantación de AI no consiste simplemente en adoptar el modelo más reciente y de mayor tamaño de la estantería. Aunque es habitual suponer que las soluciones de AI están listas para usar o que aumentar el tamaño del modelo conduce automáticamente a mejores resultados, este enfoque rara vez satisface las necesidades especializadas de la mayoría de las empresas. En realidad, el éxito de las aplicaciones requiere soluciones de AI que sean personalizadas, flexibles y eficientes.

Para lograrlo, recurrimos a los sistemas compuestos AI . A diferencia de los modelos únicos y monolíticos, los sistemas compuestos AI integran múltiples componentes especializados AI , cada uno optimizado para una función específica. Esta estructura garantiza un alto grado de personalización, adaptabilidad y precisión, transformando AI de una herramienta general en una solución a medida. Mediante la combinación de componentes AI más pequeños e interconectados, las empresas pueden lograr un rendimiento y unos resultados que superan con creces el alcance de los modelos estándar por sí solos. Por lo tanto, para lograr un impacto empresarial óptimo en todos los sectores, sostenemos que una visión estratégica debería dar prioridad a diseños de sistemas más inteligentes frente a la simple construcción de modelos más grandes y exigentes desde el punto de vista computacional.

Comprensión de los sistemas compuestos AI

El laboratorio de investigación de Berkeley Inteligencia Artificial (BAIR) define un sistema compuesto AI como un sistema "que aborda las tareas de AI utilizando múltiples componentes que interactúan, incluidas múltiples llamadas a modelos, recuperadores o herramientas externas". Por ejemplo, el sistema Retrieval Augmented Generation (RAG ) es un sistema compuesto que combina un Large Language Model (LLM), un mecanismo de recuperación de información y una base de datos vectorizada. En cambio, un modelo generativo AI es un modelo estadístico; por ejemplo, un LLM predice el siguiente token del texto basándose en el entrenamiento data.

En este contexto, un modelo puede verse como un bloque único, mientras que un sistema compuesto AI se parece más a una máquina compuesta por múltiples bloques de construcción, cada uno de los cuales cumple una función específica para alcanzar el objetivo general del sistema.

Sistemas compuestos de AI - Modelos frente a sistemas compuestos de AI .

Modelos frente a AI Sistemas compuestos. Fuente

¿En qué son útiles estos sistemas?

Especialización: Un gran martillo no es la herramienta adecuada para todo

A la hora de abordar aplicaciones o necesidades industriales específicas, confiar en un modelo AI de uso general como GPT-4 puede no ser suficiente. Aunque potentes, estos modelos están diseñados para gestionar una amplia gama de tareas y pueden carecer de los conocimientos especializados necesarios para aplicaciones concretas, lo que hace que el rendimiento disminuya a partir de cierto punto.

Por ejemplo, una institución financiera que quiera desarrollar un chatbot para el análisis de inversiones o la gestión de patrimonios necesita un sistema que incorpore tanto conocimientos especializados como experiencia específica de la empresa. Dada la naturaleza de la industria, habría preocupaciones en torno a la privacidad (la empresa puede requerir soluciones locales y el uso exclusivo de modelos abiertos), la precisión (las soluciones deben ser impecablemente precisas) y la eficiencia. Utilizar incluso los modelos lingüísticos más potentes como solución independiente no sería, desde luego, la opción óptima. En su lugar, un sistema compuesto AI podría ser muy eficaz integrando múltiples componentes especializados, como los sistemas de generación mejorada por recuperación (RAG) y los agentes a medida AI . Este enfoque garantiza que cada parte del sistema esté optimizada para su función específica.

Flexibilidad: Los sistemas modulares se adaptan fácilmente a las necesidades cambiantes

Cuando un sistema se construye con componentes modulares, sustituir o actualizar las piezas individuales resulta mucho más sencillo. El mismo principio se aplica a los sistemas compuestos AI , que se construyen a partir de múltiples bloques. Si un componente de una solución compuesta AI se queda obsoleto o no cumple los nuevos requisitos de conformidad, puede sustituirse sin necesidad de revisar todo el sistema. Por ejemplo, si aparece un nuevo modelo más adecuado, puede integrarse en el sistema para sustituir a la versión anterior. Del mismo modo, si se desarrolla un mecanismo de recuperación de información más eficaz, puede cambiarse sin alterar toda la configuración. Esta flexibilidad se extiende más allá de los modelos y los sistemas de recuperación a otros componentes, como las unidades de procesamiento data , los motores de análisis o los módulos de cumplimiento.

Escalabilidad: Enjambres de componentes inteligentes superan a un único gigante

La naturaleza modular de los sistemas compuestos AI Servicios ofrece importantes ventajas en cuanto a escalabilidad. Al permitir que los componentes individuales se amplíen de forma independiente, estos sistemas pueden gestionar eficazmente volúmenes y complejidad crecientes de data sin necesidad de una revisión completa.

Un sistema puede escalarse replicándolo en una red de sistemas, lo que teóricamente permite una escalabilidad infinita. Por eso, un único modelo lingüístico, por grande o potente que sea (a día de hoy), no puede buscar eficazmente una información concreta en una base de datos muy grande. Para ampliar las capacidades de búsqueda de un modelo, será inevitable crear un sistema multicomponente que mejore la función de búsqueda. Si ni siquiera las tareas más sencillas, como la recuperación de información, pueden ser escaladas eficazmente por un único modelo, queda claro que los componentes individuales, por sí solos, no pueden soportar aplicaciones complejas a gran escala.

Por qué los sistemas compuestos AI tienen sentido desde el punto de vista empresarial

Desde una perspectiva empresarial, la adopción de sistemas compuestos AI va más allá de la sofisticación técnica: proporciona ventajas estratégicas que se alinean directamente con los objetivos empresariales. Incluso se podría argumentar que si una empresa desea aprovechar la capacidad generativa de AI, no tiene más remedio que construir (o comprar) un sistema compuesto. Aunque esto pueda parecer sencillo, pone en tela de juicio el supuesto empresarial común de que los modelos independientes y listos para usar son suficientes para satisfacer demandas especializadas.

Mayor satisfacción del cliente

Los modelos más avanzados de AI , por sí solos, no pueden crear una experiencia personalizada. Esto sólo puede lograrse mediante un sistema compuesto que permita ofrecer experiencias de cliente altamente personalizadas y contextualmente relevantes. Por ejemplo, Custom Neural Voice de Microsoft combina los LLM generales con un entrenamiento de voz personalizado, lo que permite a las marcas crear asistentes digitales que se alinean con precisión con su tono y estilo únicos. Este nivel de personalización es especialmente potente en sectores orientados al cliente, como la publicidad, donde los clientes responden positivamente al sentirse especiales y comprendidos. Desde una perspectiva empresarial, la combinación de esta tecnología con la capacidad de añadir contexto da lugar a resultados personalizados que, en última instancia, aumentan la satisfacción del cliente.

Eficiencia de costes

A diferencia de los modelos individuales, que proporcionan un nivel fijo de calidad a un coste fijo, el compuesto AI Servicios configuraciones flexibles de coste-calidad. Por ejemplo, las empresas pueden integrar un modelo más pequeño, ajustado a las instrucciones, con componentes especializados, como la heurística de búsqueda, para lograr resultados de alta calidad a un coste inferior en comparación con modelos más grandes e independientes. Esta flexibilidad permite utilizar modelos más pequeños, potencialmente de código abierto, que, con una ingeniería específica, pueden ofrecer resultados comparables a soluciones más caras.

Mayor control y confianza

Para las empresas, la fiabilidad de los resultados de AI es crucial. Confiar únicamente en modelos individuales puede dificultar la obtención de resultados coherentes y bien formateados. Por ejemplo, un antiguo cliente del sector educativo me pidió una solución para cumplimentar automáticamente las solicitudes basándose en la información y los datos de su centro de enseñanza data . Al principio, pasé meses elaborando un sistema secuencial basado en la ingeniería avanzada de solicitudes, sin utilizar un enfoque compuesto. Los resultados mejoraron, pero nunca se acercaron lo suficiente a lo que podíamos presentar como solicitudes totalmente cumplimentadas. Sólo cuando se introdujo el concepto de GAR empezaron a aparecer resultados totalmente controlados. Sin embargo, ni siquiera la GAR por sí sola era suficiente; se necesitaban componentes adicionales para categorizar la información, mantener la coherencia del contexto y manejar otros matices. Sólo entonces conseguimos la fiabilidad y precisión que el cliente necesitaba.

Conclusión

El examen del panorama actual de AI en aplicaciones industriales revela una tendencia clara: confiar en un único modelo para realizar funciones complejas suele resultar poco fiable. A medida que los casos de uso se vuelven más intrincados y crece la adopción por parte de las empresas, la demanda de soluciones AI altamente especializadas y capaces está llamada a aumentar. Para satisfacer esta demanda, hay que orquestar una arquitectura de soluciones que incorpore modelos mejorados y especializados, evitando el escollo de tener un alcance estrecho y unilateral.

La comunidad de desarrolladores bulle con aplicaciones apasionantes que abarcan campos que van desde la medicina al comercio minorista, todas ellas creadas ensamblando componentes más pequeños y especializados en soluciones potentes y a medida.

Incluso AI, por sí sola, no es lo bastante inteligente para lograr objetivos empresariales estratégicos. Debe complementarse con una forma superior de inteligencia orquestada.

Anexo

Ejemplos de sistemas compuestos AI

A continuación se presenta una colección de impactantes e interesantes sistemas compuestos de AI que ponen de manifiesto la utilidad de este concepto. Independientemente de la infraestructura que utilicen los desarrolladores, el objetivo es observar cómo la combinación de varios componentes de AI con otras herramientas puede lograr un propósito muy concreto.

RAG mejora el resultado de un LLM proporcionando un contexto específico obtenido de una base de datos vectorizada que se encuentra fuera del entrenamiento original del modelo data. Mientras que los LLM se entrenan en vastos conjuntos de datos y aprovechan miles de millones de parámetros para generar respuestas, RAG va un paso más allá. Permite al LLM acceder a información específica y actualizada, ya sea específica de un dominio o extraída de la base de conocimientos interna de una organización. Este proceso mejora significativamente la relevancia, precisión y utilidad del contenido generado, todo ello sin necesidad de volver a entrenar el modelo.

Las empresas con grandes conjuntos de datos que necesitan un método eficaz para organizar el conocimiento interno pueden implantar esta solución in situ, utilizando el modelo de su elección, para recuperar piezas precisas de información. Por ejemplo, los analistas financieros pueden localizar rápidamente los data relevantes dentro del histórico reports sin necesidad de hacer una criba manual de cada uno de ellos. El modelo, mejorado por esta información contextual, también genera respuestas más precisas y útiles, agilizando todo el proceso de recuperación de información.

A continuación se muestra una arquitectura RAG típica:

Artículo: Sistemas compuestos de AI : Arquitectura RAG general

Arquitectura general RAG

A continuación se ofrece una tabla con algunos sistemas compuestos habituales de AI (fuente):

Artículo: Sistemas compuestos de AI

Más información sobre otros sistemas compuestos interesantes AI