Einleitung
Seit ihrem rasanten Durchbruch Mitte 2022 AI generative AI weltweit schnell für Aufsehen gesorgt. Was sich anfangs auf die Sprachmodalität konzentrierte, hat sich seitdem auf spannende neue Bereiche ausgeweitet, darunter Bild-, Audio- und Videomodelle. Anfang 2023 nahmen die Spekulationen über die potenziellen Auswirkungen der Technologie auf Unternehmen in verschiedenen Branchen zu, begleitet von spannenden ersten Anwendungsbeispielen. Als immer mehr Entwickler begannen, Lösungen mit diesen Modellen zu entwickeln, verlagerte sich die allgemeine Wahrnehmung hin zur kontinuierlichen Entstehung neuerer, größerer und hoffentlich besserer Versionen der am weitesten verbreiteten Modelle.
Zu Beginn des Jahres 2024 hat sich eine wichtige Erkenntnis herauskristallisiert: Beim Einsatz AI einfach darum, das neueste und größte Modell von der Stange zu übernehmen. Auch wenn oft angenommen wird, dass AI bereits fertig entwickelt sind oder dass eine größere Modellgröße automatisch zu besseren Ergebnissen führt, wird dieser Ansatz den spezifischen Anforderungen der meisten Unternehmen selten gerecht. In Wirklichkeit erfordern erfolgreiche Anwendungen maßgeschneiderte, flexible und effiziente AI .
Um dies zu erreichen, setzen wir auf zusammengesetzte AI . Im Gegensatz zu einzelnen, monolithischen Modellen integrieren zusammengesetzte AI mehrere spezialisierte AI , die jeweils für eine bestimmte Aufgabe optimiert sind. Diese Struktur gewährleistet ein hohes Maß an Anpassungsfähigkeit, Flexibilität und Präzision und verwandelt AI einem allgemeinen Werkzeug in eine maßgeschneiderte Lösung. Durch die Kombination kleinerer, miteinander vernetzter AI können Unternehmen Leistungen und Ergebnisse erzielen, die weit über den Rahmen von Standardmodellen hinausgehen. Für eine optimale geschäftliche Wirkung branchenübergreifend plädieren wir daher dafür, dass eine strategische Vision intelligenteren Systemdesigns Vorrang vor dem bloßen Aufbau größerer, rechenintensiverer Modelle einräumen sollte.
Komplexe AI verstehen
Das Berkeley Artificial Intelligence Lab (BAIR) definiert ein zusammengesetztes AI als ein System , „das AI mithilfe mehrerer interagierender Komponenten bewältigt, darunter mehrere Aufrufe von Modellen, Retrievern oder externen Tools“. Beispielsweise ist ein Retrieval Augmented Generation (RAG)-System ein zusammengesetztes System, das ein großes Sprachmodell (LLM), einen Mechanismus zur Informationsgewinnung und eine vektorisierte Datenbank kombiniert. Im Gegensatz dazu ist ein generatives AI ein statistisches Modell; so sagt beispielsweise ein LLM das nächste Token in einem Text auf der Grundlage von data voraus.
In diesem Zusammenhang kann ein Modell als einzelner Baustein betrachtet werden, während ein zusammengesetztes AI eher einer Maschine gleicht, die aus mehreren Bausteinen besteht, von denen jeder eine bestimmte Funktion erfüllt, um das Gesamtziel des Systems zu erreichen.

Modelle vs. AI Systeme. Quelle
Inwiefern sind solche Systeme hilfreich?
Spezialisierung: Ein großer Hammer ist nicht für alles das richtige Werkzeug
Wenn es um spezifische Anwendungen oder Branchenanforderungen geht, reicht der Einsatz eines universellen AI wie GPT-4 möglicherweise nicht aus. Solche Modelle sind zwar leistungsstark, aber darauf ausgelegt, ein breites Spektrum an Aufgaben zu bewältigen, und verfügen möglicherweise nicht über das für bestimmte Anwendungen erforderliche Fachwissen, was ab einem bestimmten Punkt zu abnehmenden Erträgen führt.
Ein Finanzinstitut, das beispielsweise einen Chatbot für die Anlageanalyse oder die Vermögensverwaltung entwickeln möchte, benötigt ein System, das sowohl Fachwissen als auch unternehmensspezifisches Know-how vereint. Angesichts der Besonderheiten der Branche bestehen Bedenken hinsichtlich des Datenschutzes (das Unternehmen könnte Lösungen vor Ort und die ausschließliche Nutzung offener Modelle verlangen), der Genauigkeit (die Lösungen müssen absolut präzise sein) und der Effizienz. Selbst die leistungsstärksten Sprachmodelle als eigenständige Lösung einzusetzen, wäre definitiv nicht die optimale Wahl. Stattdessen könnte ein zusammengesetztes AI durch die Integration mehrerer spezialisierter Komponenten, wie beispielsweise Retrieval-Augmented-Generation-Systeme (RAG) und maßgeschneiderte AI , äußerst effektiv sein. Dieser Ansatz stellt sicher, dass jeder Teil des Systems für seine spezifische Rolle optimiert ist.
Flexibilität: Modulare Systeme passen sich mühelos an sich ändernde Anforderungen an
Wenn ein System aus modularen Komponenten aufgebaut ist, wird das Ersetzen oder Aktualisieren einzelner Teile wesentlich einfacher. Das gleiche Prinzip gilt für zusammengesetzte AI , die aus mehreren Bausteinen bestehen. Wenn eine Komponente innerhalb einer zusammengesetzten AI veraltet ist oder neue Compliance-Anforderungen nicht mehr erfüllt, kann sie ersetzt werden, ohne dass eine komplette Überarbeitung des gesamten Systems erforderlich ist. Wenn beispielsweise ein neues, besser geeignetes Modell verfügbar wird, kann es in das System integriert werden, um die ältere Version zu ersetzen. Ebenso kann ein effizienterer Mechanismus zur Informationsgewinnung, sobald dieser entwickelt wurde, ausgetauscht werden, ohne das gesamte System zu stören. Diese Flexibilität erstreckt sich über Modelle und Abrufsysteme hinaus auf andere Komponenten wie data , Analyse-Engines oder Compliance-Module.
Skalierbarkeit: Schwärme intelligenter Komponenten übertreffen einen einzelnen Riesen
Der modulare Aufbau zusammengesetzter AI bietet erhebliche Vorteile hinsichtlich der Skalierbarkeit. Da einzelne Komponenten unabhängig voneinander skaliert werden können, sind diese Systeme in der Lage, steigende data und zunehmende Komplexität effizient zu bewältigen, ohne dass eine vollständige Überarbeitung erforderlich ist.
Ein System lässt sich skalieren, indem man es in ein Netzwerk von Systemen repliziert, was theoretisch eine unbegrenzte Skalierbarkeit ermöglicht. Aus diesem Grund kann ein einzelnes Sprachmodell, egal wie groß oder leistungsfähig es (zum jetzigen Zeitpunkt) auch sein mag, eine sehr große Datenbank nicht effektiv nach einer bestimmten Information durchsuchen. Um die Suchfähigkeiten eines Modells zu erweitern, muss man zwangsläufig ein aus mehreren Komponenten bestehendes System erstellen, um die Suchfunktion zu verbessern. Wenn selbst einfachste Aufgaben wie die Informationsgewinnung nicht durch ein einzelnes Modell effektiv skaliert werden können, wird deutlich, dass einzelne Komponenten für sich genommen keine groß angelegten, komplexen Anwendungen unterstützen können.
Warum komplexe AI wirtschaftlich sinnvoll sind
Aus geschäftlicher Sicht geht die Einführung komplexer AI über die reine technische Raffinesse hinaus – sie bietet strategische Vorteile, die direkt mit den Unternehmenszielen im Einklang stehen. Man könnte sogar argumentieren, dass ein Unternehmen, das generative AI nutzen möchte, keine andere Wahl hat, als ein komplexes System aufzubauen (oder zu erwerben). Auch wenn dies auf den ersten Blick einfach erscheinen mag, stellt es die gängige Annahme in der Wirtschaft in Frage, dass eigenständige, handelsübliche Modelle ausreichen, um spezielle Anforderungen zu erfüllen.
Höhere Kundenzufriedenheit
Die fortschrittlichsten AI allein sind nicht in der Lage, ein personalisiertes Erlebnis zu schaffen. Dies lässt sich nur durch ein komplexes System erreichen, das die Bereitstellung hochgradig maßgeschneiderter und kontextbezogener Kundenerlebnisse ermöglicht. So kombiniert beispielsweise Microsofts Custom Neural Voice allgemeine LLMs mit maßgeschneidertem Sprachtraining, wodurch Marken digitale Assistenten entwickeln können, die genau auf ihren individuellen Tonfall und Stil abgestimmt sind. Dieser Grad an Individualisierung ist besonders wirkungsvoll in kundenorientierten Branchen wie der Werbung, in denen Kunden positiv darauf reagieren, wenn sie sich besonders und verstanden fühlen. Aus geschäftlicher Sicht führt die Kombination dieser Technologie mit der Fähigkeit, Kontext hinzuzufügen, zu personalisierten Ergebnissen, was letztlich die Kundenzufriedenheit steigert.
Kosteneffizienz
Im Gegensatz zu einzelnen Modellen, die ein festes Qualitätsniveau zu festen Kosten bieten, AI zusammengesetzte AI flexible Kosten-Qualitäts-Konfigurationen. So können Unternehmen beispielsweise ein kleineres, auf bestimmte Aufgaben abgestimmtes Modell mit spezialisierten Komponenten wie Suchheuristiken kombinieren, um im Vergleich zu größeren, eigenständigen Modellen qualitativ hochwertige Ergebnisse zu geringeren Kosten zu erzielen. Diese Flexibilität ermöglicht den Einsatz kleinerer, möglicherweise aus dem Open-Source-Bereich stammender Modelle, die durch gezielte Anpassung Ergebnisse liefern können, die mit teureren Lösungen vergleichbar sind.
Mehr Kontrolle und Vertrauen
Für Unternehmen sind Zuverlässigkeit und Vertrauenswürdigkeit bei AI von entscheidender Bedeutung. Sich ausschließlich auf einzelne Modelle zu verlassen, kann es schwierig machen, durchweg sachliche und gut formatierte Ergebnisse zu erzielen. So bat beispielsweise ein früherer Kunde aus dem Bildungssektor einmal um eine Lösung zum automatischen Ausfüllen von Anträgen auf der Grundlage seiner data -informationen. Zunächst verbrachte ich Monate damit, ein sequenzielles System auf der Grundlage fortschrittlicher Prompt-Engineering-Techniken zu entwickeln, ohne einen kombinierten Ansatz zu verwenden. Die Ergebnisse verbesserten sich zwar, kamen aber nie annähernd dem nahe, was wir als vollständig ausgefüllte Anträge präsentieren konnten. Erst als das RAG-Konzept eingeführt wurde, zeigten sich vollständig kontrollierte Ergebnisse. Doch selbst RAG allein reichte nicht aus; es waren zusätzliche Komponenten erforderlich, um Informationen zu kategorisieren, die Kontextkohärenz zu wahren und andere Nuancen zu berücksichtigen. Erst dann erreichten wir die Zuverlässigkeit und Präzision, die der Kunde benötigte.
Fazit
Ein Blick auf die aktuelle Landschaft der AI industriellen Anwendungen zeigt einen klaren Trend: Sich bei der Ausführung komplexer Funktionen auf ein einziges Modell zu verlassen, erweist sich oft als unzuverlässig. Da die Anwendungsfälle immer komplexer werden und die Akzeptanz in Unternehmen zunimmt, wird die Nachfrage nach hochspezialisierten und leistungsfähigen AI voraussichtlich steigen. Um dieser Nachfrage gerecht zu werden, muss eine Lösungsarchitektur entwickelt werden, die verbesserte und spezialisierte Modelle einbezieht und dabei die Gefahr eines zu engen, einseitigen Anwendungsbereichs vermeidet.
In der Entwickler-Community herrscht große Begeisterung für spannende Anwendungen, die von der Medizin bis zum Einzelhandel reichen und alle durch die Kombination kleinerer, spezialisierter Komponenten zu leistungsstarken, maßgeschneiderten Lösungen entstanden sind.
Selbst AI allein ist nicht intelligent genug, um strategische Geschäftsziele zu erreichen. Sie muss durch eine höhere Form koordinierter Intelligenz ergänzt werden.
Anhang
Beispiele für komplexe AI
Im Folgenden finden Sie eine Auswahl beeindruckender und interessanter zusammengesetzter AI , die den Nutzen dieses Konzepts verdeutlichen. Unabhängig davon, welche Infrastruktur die Entwickler nutzen, besteht das Ziel darin, zu zeigen, wie durch die Kombination mehrerer AI mit anderen Tools ein ganz bestimmtes Ziel erreicht werden kann.
RAG verbessert die Ausgabe eines LLM, indem es spezifischen Kontext bereitstellt, der aus einer vektorisierten Datenbank stammt, die außerhalb der ursprünglichen data des Modells liegt. Während LLMs auf riesigen Datensätzen trainiert werden und Milliarden von Parametern nutzen, um Antworten zu generieren, geht RAG noch einen Schritt weiter. Es ermöglicht dem LLM, auf spezifische, aktuelle Informationen zuzugreifen und darauf Bezug zu nehmen, unabhängig davon, ob diese fachspezifisch sind oder aus der internen Wissensdatenbank eines Unternehmens stammen. Dieser Prozess verbessert die Relevanz, Genauigkeit und Nützlichkeit der generierten Inhalte erheblich, ohne dass das Modell neu trainiert werden muss.
Unternehmen mit großen Datenmengen, die eine effiziente Methode zur Organisation ihres internen Wissens benötigen, können diese Lösung vor Ort unter Verwendung eines Modells ihrer Wahl einsetzen, um präzise Informationen abzurufen. So können beispielsweise Finanzanalysten relevante data historischen reports schnell ausfindig machen, reports jeden einzelnen Bericht manuell durchsehen zu müssen. Das durch diese Kontextinformationen erweiterte Modell liefert zudem genauere und nützlichere Antworten und optimiert so den gesamten Prozess der Informationsbeschaffung.
Im Folgenden wird eine typische RAG-Architektur dargestellt:

Allgemeine RAG-Architektur
Nachfolgend finden Sie eine Tabelle mit einigen gängigen zusammengesetzten AI (Quelle):


BLOG






