Einführung
Seit ihrem explosionsartigen Aufkommen Mitte 2022 hat die generative Methode AI schnell weltweite Aufmerksamkeit erlangt. Was sich zunächst auf die Sprachmodalität konzentrierte, hat sich inzwischen auf spannende neue Bereiche ausgeweitet, darunter Bild-, Audio- und Videomodelle. Anfang 2023 wurden Spekulationen über die potenziellen Auswirkungen der Technologie auf Unternehmen in verschiedenen Branchen laut, begleitet von spannenden ersten Anwendungsfällen. Als immer mehr Entwickler begannen, Lösungen mit diesen Modellen zu entwickeln, verschob sich die allgemeine Wahrnehmung in Richtung einer kontinuierlichen Entwicklung neuer, größerer und hoffentlich besserer Versionen der am häufigsten verwendeten Modelle.
Auf dem Weg ins Jahr 2024 hat sich eine wichtige Erkenntnis herauskristallisiert: Bei der Bereitstellung von AI geht es nicht einfach darum, das neueste, größte Modell von der Stange zu übernehmen. Zwar wird häufig davon ausgegangen, dass AI Lösungen von der Stange sind oder dass eine größere Modellgröße automatisch zu besseren Ergebnissen führt, doch wird dieser Ansatz den speziellen Anforderungen der meisten Unternehmen kaum gerecht. In Wirklichkeit erfordern erfolgreiche Anwendungen AI Lösungen, die maßgeschneidert, flexibel und effizient sind.
Um dies zu erreichen, wenden wir uns an Compound AI Systems. Im Gegensatz zu einzelnen, monolithischen Modellen integrieren zusammengesetzte AI Systeme mehrere spezialisierte AI Komponenten, die jeweils für eine bestimmte Aufgabe optimiert sind. Diese Struktur gewährleistet ein hohes Maß an Anpassbarkeit, Anpassungsfähigkeit und Präzision und verwandelt AI von einem allgemeinen Werkzeug in eine zweckgebundene Lösung. Durch die Kombination kleinerer, miteinander verbundener AI Komponenten können Unternehmen Leistungen und Ergebnisse erzielen, die weit über die Möglichkeiten von Standardmodellen hinausgehen. Daher argumentieren wir, dass eine strategische Vision für eine optimale Auswirkung auf das Geschäft über alle Branchen hinweg intelligenteren Systemdesigns den Vorrang vor dem einfachen Aufbau größerer, rechenintensiverer Modelle geben sollte.
Verstehen von zusammengesetzten AI Systemen
Das Berkeley Artificial Intelligence Research lab (BAIR) definiert ein zusammengesetztes AI System als ein System , "das AI Aufgaben unter Verwendung mehrerer interagierender Komponenten, einschließlich mehrerer Aufrufe von Modellen, Retrievern oder externen Tools, bewältigt". Zum Beispiel ist das Retrieval Augmented Generation (RAG) System ein zusammengesetztes System, das ein Large Language Model (LLM), einen Information Retrieval Mechanismus und eine vektorisierte Datenbank kombiniert. Im Gegensatz dazu ist ein generatives AI Modell ein statistisches Modell; zum Beispiel sagt ein LLM das nächste Token im Text auf der Grundlage von Training data voraus.
In diesem Zusammenhang kann ein Modell als ein einzelner Baustein betrachtet werden, während ein zusammengesetztes System ( AI ) eher einer Maschine gleicht, die aus mehreren Bausteinen besteht, von denen jeder eine bestimmte Funktion erfüllt, um das Gesamtziel des Systems zu erreichen.
Modelle vs. AI Verbundsysteme. Quelle
Wie sind solche Systeme hilfreich?
Spezialisierung: Ein großer Hammer ist nicht das richtige Werkzeug für alles
Wenn es um spezifische Anwendungen oder Branchenbedürfnisse geht, reicht es möglicherweise nicht aus, sich auf ein Allzweckmodell wie GPT-4 ( AI ) zu verlassen. Solche Modelle sind zwar leistungsfähig, aber für ein breites Aufgabenspektrum konzipiert und verfügen möglicherweise nicht über das für bestimmte Anwendungen erforderliche Spezialwissen, was ab einem bestimmten Punkt zu einem abnehmenden Nutzen führt.
So benötigt beispielsweise ein Finanzinstitut, das einen Chatbot für die Anlageanalyse oder die Vermögensverwaltung entwickeln möchte, ein System, das sowohl Fachwissen als auch unternehmensspezifisches Know-how umfasst. In Anbetracht der Art der Branche gäbe es Bedenken hinsichtlich des Datenschutzes (das Unternehmen benötigt möglicherweise Lösungen vor Ort und die ausschließliche Verwendung offener Modelle), der Genauigkeit (die Lösungen müssen tadellos genau sein) und der Effizienz. Die Verwendung selbst der leistungsfähigsten Sprachmodelle als Einzellösung wäre definitiv nicht die optimale Wahl. Stattdessen könnte ein zusammengesetztes AI System durch die Integration mehrerer spezialisierter Komponenten, wie Retrieval-Augmented Generation (RAG) Systeme und maßgeschneiderte AI Agenten, sehr effektiv sein. Mit diesem Ansatz wird sichergestellt, dass jeder Teil des Systems für seine spezifische Rolle optimiert ist.
Flexibel: Modulare Systeme passen sich problemlos an sich ändernde Bedürfnisse an
Wenn ein System aus modularen Komponenten aufgebaut ist, ist es viel einfacher, einzelne Teile zu ersetzen oder aufzurüsten. Das gleiche Prinzip gilt für zusammengesetzte AI Systeme, die aus mehreren Blöcken aufgebaut sind. Wenn eine Komponente innerhalb einer zusammengesetzten AI Lösung veraltet ist oder neue Anforderungen nicht mehr erfüllt, kann sie ersetzt werden, ohne dass das gesamte System überholt werden muss. Wenn zum Beispiel ein neues, besser geeignetes Modell verfügbar wird, kann es in das System integriert werden und die ältere Version ersetzen. Wird ein effizienterer Mechanismus für die Informationsbeschaffung entwickelt, kann er ebenfalls ausgetauscht werden, ohne dass die gesamte Einrichtung unterbrochen werden muss. Diese Flexibilität erstreckt sich nicht nur auf Modelle und Abfragesysteme, sondern auch auf andere Komponenten, wie z. B. data Verarbeitungseinheiten, Analysemaschinen oder Compliance-Module.
Skalierbarkeit: Schwärme intelligenter Komponenten übertreffen einen einzelnen Giganten
Der modulare Charakter von AI Systemen bietet erhebliche Vorteile bei der Skalierbarkeit. Da die einzelnen Komponenten unabhängig voneinander skaliert werden können, können diese Systeme steigende data Mengen und Komplexität effizient bewältigen, ohne dass eine komplette Überholung erforderlich ist.
Ein System kann skaliert werden, indem es in ein Netz von Systemen repliziert wird, was theoretisch eine unendliche Skalierbarkeit ermöglicht. Aus diesem Grund kann ein einzelnes Sprachmodell, egal wie groß oder leistungsfähig es ist (Stand heute), eine sehr große Datenbank nicht effektiv nach einer bestimmten Information durchsuchen. Um die Suchfähigkeiten eines Modells zu erweitern, müssen Sie zwangsläufig ein Mehrkomponentensystem schaffen, um die Suchfunktion zu verbessern. Wenn selbst einfachste Aufgaben, wie die Informationsbeschaffung, von einem einzelnen Modell nicht effektiv skaliert werden können, wird deutlich, dass einzelne Komponenten für sich genommen keine großen, komplexen Anwendungen unterstützen können.
Warum Compound AI Systeme geschäftlich sinnvoll sind
Aus geschäftlicher Sicht geht die Einführung von Verbundsystemen AI über technische Raffinesse hinaus - sie bietet strategische Vorteile, die direkt mit den Unternehmenszielen übereinstimmen. Man könnte sogar argumentieren, dass ein Unternehmen, das das generative System AI nutzen möchte, keine andere Wahl hat, als ein Verbundsystem zu bauen (oder zu kaufen). Dies mag zwar einfach erscheinen, stellt aber die gängige Annahme in Frage, dass eigenständige Modelle von der Stange ausreichen, um spezielle Anforderungen zu erfüllen.
Erhöhte Kundenzufriedenheit
Die fortschrittlichsten Modelle von AI allein können kein personalisiertes Erlebnis schaffen. Dies kann nur durch ein zusammengesetztes System erreicht werden, das die Bereitstellung hochgradig maßgeschneiderter und kontextbezogener Kundenerfahrungen ermöglicht. Die benutzerdefinierte neuronale Stimme von Microsoft kombiniert beispielsweise allgemeine LLMs mit benutzerdefiniertem Stimmtraining und ermöglicht es Marken, digitale Assistenten zu erstellen, die genau auf ihren einzigartigen Ton und Stil abgestimmt sind. Dieses Maß an Individualisierung ist besonders in kundenorientierten Branchen wie der Werbung von Vorteil, wo Kunden positiv reagieren, wenn sie sich besonders angesprochen und verstanden fühlen. Aus geschäftlicher Sicht führt die Kombination dieser Technologie mit der Möglichkeit, Kontext hinzuzufügen, zu personalisierten Ergebnissen, die letztlich die Kundenzufriedenheit erhöhen.
Kosteneffizienz
Im Gegensatz zu Einzelmodellen, die ein festes Qualitätsniveau zu festen Kosten bieten, bietet Compound AI flexible Kosten-Qualitäts-Konfigurationen. So können Unternehmen beispielsweise ein kleineres, auf Anweisungen abgestimmtes Modell mit spezialisierten Komponenten wie Suchheuristiken integrieren, um qualitativ hochwertige Ergebnisse zu niedrigeren Kosten als bei größeren, eigenständigen Modellen zu erzielen. Diese Flexibilität ermöglicht den Einsatz kleinerer, potenziell quelloffener Modelle, die mit gezieltem Engineering vergleichbare Ergebnisse wie teurere Lösungen liefern können.
Mehr Kontrolle und Vertrauen
Für Unternehmen sind die Zuverlässigkeit und Vertrauenswürdigkeit der Ergebnisse von AI von entscheidender Bedeutung. Wenn man sich ausschließlich auf individuelle Modelle verlässt, kann es schwierig sein, durchgängig sachliche, gut formatierte Ergebnisse zu erzielen. Ein Beispiel: Ein früherer Kunde aus dem Bildungssektor benötigte eine Lösung für das automatische Ausfüllen von Bewerbungen auf der Grundlage seiner Schule data und seiner Informationen. Anfangs verbrachte ich Monate damit, ein sequentielles System zu entwickeln, das auf fortschrittlicher Eingabeaufforderungstechnik basierte, ohne einen zusammengesetzten Ansatz zu verwenden. Die Ergebnisse verbesserten sich zwar, aber sie reichten nie an das heran, was wir als vollständig ausgefüllte Bewerbungen präsentieren konnten. Erst mit der Einführung des RAG-Konzepts konnten wir vollständig kontrollierte Ergebnisse erzielen. Doch selbst RAG allein reichte nicht aus; es waren zusätzliche Komponenten erforderlich, um Informationen zu kategorisieren, die Kontextkohärenz zu wahren und andere Nuancen zu behandeln. Erst dann erreichten wir die Zuverlässigkeit und Präzision, die der Kunde benötigte.
Schlussfolgerung
Ein Blick auf die aktuelle Landschaft von AI in industriellen Anwendungen zeigt einen klaren Trend: Sich auf ein einziges Modell zu verlassen, um komplexe Funktionen auszuführen, erweist sich oft als unzuverlässig. Da die Anwendungsfälle immer komplexer werden und die Akzeptanz in den Unternehmen wächst, wird die Nachfrage nach hochspezialisierten und leistungsfähigen AI Lösungen steigen. Um diese Nachfrage zu befriedigen, muss eine Lösungsarchitektur geschaffen werden, die erweiterte und spezialisierte Modelle einschließt und den Fallstrick eines engen, einseitigen Anwendungsbereichs vermeidet.
Die Entwickler-Community ist voller aufregender Anwendungen, die von der Medizin bis zum Einzelhandel reichen und alle durch den Zusammenbau kleinerer, spezialisierter Komponenten zu leistungsstarken, maßgeschneiderten Lösungen entstehen.
Selbst AI ist für sich genommen nicht intelligent genug, um strategische Unternehmensziele zu erreichen. Sie muss durch eine höhere Form der orchestrierten Intelligenz ergänzt werden.
Anhang
Beispiele für zusammengesetzte Systeme AI
Im Folgenden finden Sie eine Sammlung wirkungsvoller und interessanter zusammengesetzter AI Systeme, die den Nutzen dieses Konzepts verdeutlichen. Unabhängig von der von den Entwicklern verwendeten Infrastruktur geht es darum, zu beobachten, wie die Kombination mehrerer AI Komponenten mit anderen Tools einen ganz bestimmten Zweck erfüllen kann.
RAG verbessert die Ergebnisse eines LLM, indem es einen spezifischen Kontext liefert, der aus einer vektorisierten Datenbank stammt, die außerhalb der ursprünglichen Trainingsdaten des Modells liegt data. Während LLMs auf umfangreichen Datensätzen trainiert werden und Milliarden von Parametern nutzen, um Antworten zu generieren, geht RAG noch einen Schritt weiter. Sie ermöglicht es dem LLM, auf spezifische, aktuelle Informationen zuzugreifen und diese zu referenzieren, unabhängig davon, ob diese domänenspezifisch sind oder aus der internen Wissensbasis eines Unternehmens stammen. Dieser Prozess verbessert die Relevanz, Genauigkeit und Nützlichkeit der generierten Inhalte erheblich, ohne dass das Modell neu trainiert werden muss.
Unternehmen mit großen Datenbeständen, die eine effiziente Methode zur Organisation von internem Wissen benötigen, können diese Lösung vor Ort einsetzen und das Modell ihrer Wahl verwenden, um präzise Informationen abzurufen. So können beispielsweise Finanzanalysten schnell relevante data in den historischen reports finden, ohne diese manuell durchforsten zu müssen. Das um diese Kontextinformationen erweiterte Modell generiert auch genauere und nützlichere Antworten und rationalisiert den gesamten Prozess der Informationsbeschaffung.
Im Folgenden wird eine typische RAG-Architektur dargestellt:
Allgemeine RAG-Architektur
Im Folgenden finden Sie eine Tabelle mit einigen gebräuchlichen zusammengesetzten Systemen AI (Quelle):