Drei unverzichtbare Voraussetzungen für die Aufrüstung des data-Stacks auf einen AI-Stack

Die meisten Unternehmen sind noch nicht bereit, ihren data-Stack aus der Dashboard-Ära durch einen AI-Stack zu ersetzen. Der aktuelle „State of Data & Analytics“-Bericht von Salesforce zeigt, dass 84% der data- und Analytics-Verantwortlichen angeben, ihre Strategien müssten grundlegend überarbeitet werden, bevor ihre AI-Ziele erfolgreich umgesetzt werden können. Die Führungskräfte schätzen, dass 261 % ihrer data-Daten unzuverlässig sind, nur 431 % geben an, über formelle data governance-Frameworks zu verfügen, und rund 501 % sind nicht zuversichtlich, zeitnahe Erkenntnisse generieren und bereitstellen zu können. Gleichzeitig glauben 70 % der Befragten, dass die wertvollsten Erkenntnisse in unstrukturierten Daten verborgen sind. Die Schlussfolgerung ist klar: Das Hindernis ist nicht der Enthusiasmus, sondern die Grundlage, und diese Grundlage muss sich ändern, bevor agentenbasierte Systeme skaliert werden können.

Agentische KI verwandelt data platforms in Aktionssysteme, die Verträge und Tickets lesen, Kameras beobachten, Anrufe abhören, mit Protokollen und Ereignissen korrelieren und dann ausführen. Dashboards können Verzögerungen tolerieren, Agenten hingegen nicht. Compliance kann durch Dokumentation funktionieren, Agenten hingegen benötigen Kontrollen zur Laufzeit. Bevor ein Unternehmen einen KI-Stack ausruft, müssen drei Elemente unverhandelbar sein: Multimodalität als Standard, Streaming als Betriebsmodus und Governance als Laufzeitsystem. In den folgenden Abschnitten werden diese Überzeugungen in architektonische Entscheidungen umgesetzt, mit denen sich agentenbasierte Arbeitslasten im Produktionsmaßstab bewältigen lassen.

Multimodal als Standard

Die Behandlung von Dokumenten, Bildern, Audio, Video und Protokollen als Assets zweiter Klasse schränkt die Möglichkeiten von Agenten von vornherein ein. Eine für Agenten geeignete Plattform speichert Tabellen und Tensoren als Peers unter einem Katalog mit einem einheitlichen Abstammungssystem und einem konsistenten Zugriffsmodell, so dass hochdimensionale Medien denselben Lebenszyklus durchlaufen können wie relationale data. In der Praxis bedeutet das: Chunked- oder Kachel-Layouts, die partielle Lesevorgänge und die Extraktion von Interessensgebieten ermöglichen; inhaltsadressierte Bezeichner mit versionierten Sidecar-Metadata, so dass jedes Artefakt reproduzierbar ist; und native Array- und Spaltenformate, die Prädikate und Koordinaten-Pushdown ermöglichen. Texte und Dokumente benötigen Einbettungen als primäres Derivat, die deterministisch generiert, mit ihren Quellen versioniert und mit klaren Kompromissen indiziert werden, z.B. HNSW, wenn der Abruf dominiert, IVF PQ, wenn Speicher und Latenzzeit ausgeglichen werden müssen, und hybride dichte plus lexikalische Indizierung, wenn Produktcodes und Nummern wesentlich sind. Das Retrieval sollte Evidenzbündel wie Passagen, Seiten, Frames oder Clips zurückgeben, da Agenten eher über Evidenz als über isolierte Teilstrings nachdenken.

Die größten Vorteile ergeben sich aus der Fusion, doch die Fusion ist nur dann wertvoll, wenn der Abgleich auf Plattformebene gelöst wird. Die frühe Fusion erfasst feinkörnige Interaktionen, wie z.B. die Ausrichtung von Textabschnitten an Bildregionen, die späte Fusion bewahrt modalitätsspezifische Modelle bis zu einer Entscheidungsgrenze, und hybride Ansätze kombinieren beide, wenn die Interaktionspunkte gut definiert sind. Der Abgleich ist der schwierige Teil. Die zeitliche Synchronisierung von Ereignissen zwischen Quellen mit unterschiedlichen Abtastraten, die räumliche Registrierung zwischen Sensoren und die semantische Verknüpfung, so dass eine Auftrags-ID in einer PDF-Datei, ein Bild einer Spur-3-Kamera, eine Erschütterungsspitze und ein Ledger-Ereignis demselben Geschäftsobjekt zugeordnet werden können, sind Fähigkeiten, die in die Katalog- und Abstammungsschicht gehören. Ohne diese gemeinsame Vorstellung von Zeit, Identität und Herkunft werden Agenten den Kontext halluzinieren oder auf veraltete Signale reagieren. Angesichts der Tatsache, dass 70% der Führungskräfte der Meinung sind, dass die wertvollsten Erkenntnisse in unstrukturierten data enthalten sind, kann Multimodalität kein Add-on der Phase zwei sein. Sie ist der Standard, der den Kontext freischaltet.

Streaming als Betriebsmodus

Agentenarbeit führt ein zentrales Serviceziel ein: die Entscheidungslatenz, also die Zeit zwischen einem realen Signal und einer akzeptablen Aktion. Um dieses Ziel zu erreichen, ist eine Streaming-First-Plattform erforderlich. Das Rückgrat ist ein Ereignisprotokoll, das als Aufzeichnungssystem fungiert, mit Schemata, die beim Schreiben erzwungen werden, und einer Ereigniszeitsemantik mit Wasserzeichen, damit die Fenster die geschäftliche Wahrheit und nicht die Ankunftsreihenfolge widerspiegeln. Auf diesem Backbone laufen zustandsbehaftete Stream-Prozessoren, die einen dauerhaften lokalen Zustand aufrechterhalten, Rückstaus vorhersehbar behandeln, heiße Streams mit kalten Referenzen verbinden data und Entscheidungen und nicht nur transformierte Zeilen ausgeben. Um die Überprüfung und Rechtfertigung sowohl durch Menschen als auch durch Agenten zu unterstützen, platzieren Sie eine Echtzeit-Analyseschicht, die direkt aus dem Protokoll einliest und sekundengenaue Abfragen über sich ständig aktualisierende Tabellen beantwortet.

Der heiße Pfad und der kalte Pfad sollten sich in der gleichen Struktur befinden. Landen Sie Datenströme in offenen Tabellenformaten mit ACID-Transaktionen und Zeitreisen, so dass replays, Backfills, Audits und Schulungen stattfinden können, ohne dass die Pipeline einfriert. Dadurch wird die falsche Wahl zwischen schnell und flüchtig auf der einen Seite und dauerhaft und langsam auf der anderen Seite aufgehoben. Operative Disziplin schließt den Kreis. Definieren Sie Verspätungsbudgets und Rückzugsregeln, dokumentieren Sie replay- und Dead-Letter-Runbooks und verwenden Sie Canary-Implementierungen mit gespiegeltem Datenverkehr, damit Rollouts reversibel sind. Wenn diese Praktiken vorhanden sind, können Betrugsagenten vor der Abrechnung blockieren, die Personalisierung kann während der Sitzung angepasst werden, Zuverlässigkeitsagenten können Wartungsarbeiten planen, wenn eine Abweichung zum ersten Mal auftritt, und Serviceagenten können eskalieren, wenn die Frustration zunimmt und nicht erst nach der Abwanderung.

Governance als Laufzeitsystem

Wenn die Autonomie zunimmt, wird Vertrauen zum Tor. Dokumentation und regelmäßige Audits verhindern keine schlechten Entscheidungen, sondern Kontrolle zur Laufzeit. Zwei Maßnahmen sorgen für diese Kontrolle. Erstens erzwingen Sie data-Verträge beim Schreiben, so dass die Hersteller Schemata, Semantik und Frischeziele veröffentlichen, die Registrierung inkompatible Änderungen blockiert oder sie in die Quarantäne leitet, die Verbraucher ihre Erwartungen erklären und automatisch Vorfälle ausgelöst werden, wenn die Erwartungen verletzt werden, so dass die Berechtigungen der Agenten herabgestuft werden, bis sich die Bedingungen erholen. Zweitens: Bewerten Sie die Richtlinie als Code für jede Aktion, unabhängig davon, ob sie von einem Menschen oder einem Agenten ausgelöst wird. Wenn ein Tool oder dataset angefordert wird, sollte eine Policy Engine auswerten, wer anruft, zu welchem Zweck, über welches data, unter welchem Risiko und mit welchen Verpflichtungen, z.B. Anhängen eines Evidenzbündels, Schwärzen sensibler Felder oder Erfordernis einer menschlichen Mitunterschrift oberhalb eines Schwellenwertes. Das Ergebnis muss eine unterzeichnete Entscheidung und ein prüfbarer Pfad sein.

Die Sicherheit erfordert eine Null-Vertrauenshaltung, die von einer Verletzung ausgeht und jeden Aufruf verifiziert. Least Privilege, kontinuierliche Überprüfung, Ausführung von Tools in Sandboxen und strikte Kontrolle der Ausgänge stehen auf dem Spiel. Agenten-spezifische Risiken wie Prompt Injection, Retrieval Poisoning und Tool-Missbrauch erfordern Telemetrie und Eindämmung zur Laufzeit und nicht nur modellzentriertes Tuning. In der gleichen Studie von Salesforce wird deutlich, was auf dem Spiel steht: Nur 43% der Führungskräfte berichten über formale Governance-Rahmenwerke, 89% der Teams, die bereits KI einsetzen, haben ungenaue oder irreführende Ergebnisse erlebt und 88% sagen, dass KI neue Governance- und Sicherheitsansätze erfordert. Bewährte Governance bedeutet, dass die Plattform nachweisen kann, wer, mit welcher data, unter welcher Richtlinie, mit welchem Modell oder welcher Toolversion gehandelt hat und wie bei Bedarf ein Rollback durchgeführt werden kann. Das ist es, was Piloten, die beeindrucken, von Systemen unterscheidet, die Audits überstehen.

Wie die drei Elemente zusammenkommen

Die Blaupause ist ein lebendiges System, das Produzenten, Speicher, Rechner und Richtlinien miteinander verbindet, ohne dass es zu Übergaben kommt, die das Vertrauen untergraben. Produzenten geben Änderungsereignisse aus und legen Artefakte wie PDFs, Bilder, Audio- und Videodateien in Chunked Storage ab, während ein globaler Katalog Assets, Eigentümer, Abstammung und geltende Richtlinien registriert. Nahezu data-Pipelines normalisieren, redigieren, betten ein und richten aus, und die resultierenden Merkmale und Einbettungen fließen in indizierte Speicher mit dokumentierten Abrufprofilen. Zustandsabhängige Stream-Prozessoren reichern die Daten an und treffen Entscheidungen, während eine analytische Oberfläche in Echtzeit neue Fakten für Menschen und Agenten bereitstellt. Parallel dazu fließen dieselben Ereignisse in offene Lakehouse-Tabellen mit ACID-Semantik und Zeitreisen, so dass Echtzeit- und historische Ansichten in einem kontrollierten Substrat leben. Die Agenten interagieren mit Hilfe von Tools, die auf dem Prinzip der geringsten Rechte beruhen. Jeder Aufruf wird anhand von Richtlinien überprüft und jede Aktion wird signiert und mit der Historie verknüpft. Dieses Muster behebt die Lücken in Bezug auf Vertrauen, Aktualität und Zugänglichkeit, die die Skalierung blockieren.

Fazit

Unternehmen, die KI skalieren wollen, sollten dem Drang widerstehen, Agentenfunktionen auf einen Stack aus der Dashboard-Ära zu schrauben. Die Grundlage muss sich zuerst ändern. Machen Sie Multimodalität zum Standard, so dass jedes nützliche Signal in einem Katalog mit gemeinsamer Identität, Zeit und Herkunft enthalten ist und die Abfrage eher Beweise als Fragmente liefert. Machen Sie Streaming zum Betriebsmodus, so dass Entscheidungen die Ereigniszeit respektieren und innerhalb eines definierten Latenzbudgets ankommen, während dieselben Streams in offenen Tabellen zur Prüfung und zum Lernen landen. Verbessern Sie die Governance von Folien zur Laufzeit, indem Sie Verträge beim Schreiben erzwingen, Richtlinien bei jeder Aktion bewerten, Zero Trust auf Tools und data anwenden und kontinuierlich beobachten, damit die Autonomie pausiert oder herabgestuft wird, wenn die Qualität nachlässt. Zusammengenommen ersetzen diese Maßnahmen ein Berichtssubstrat durch ein Aktionssubstrat. Die Agenten arbeiten dann auf der Grundlage frischer multimodaler Daten innerhalb expliziter Leitplanken und mit eingebauten Erklärungen. So werden Piloten zu Produzenten und KI schafft Werte statt Ausnahmen.