Data Platforms for the Agentic Era

Drie onmisbare punten voordat u de data stack upgradet naar een AI stack

De meeste bedrijven zijn nog niet klaar om een data-stack uit het dashboard-tijdperk te vervangen door een AI-stack. De meest recente State of Data & Analytics van Salesforce geeft aan dat 84% van de leiders op het gebied van data en analytics zeggen dat hun strategieën volledig moeten worden herzien voordat de AI-ambities kunnen slagen. Leiders schatten in dat 26% van hun data onbetrouwbaar is, slechts 43% maken melding van formele data governance-raamwerken en ongeveer 50% hebben geen vertrouwen in hun vermogen om tijdig inzichten te genereren en te leveren. Tegelijkertijd geloven 70% dat de meest waardevolle inzichten opgesloten zitten in ongestructureerd data. De conclusie is duidelijk: het obstakel is niet enthousiasme, maar de basis, en die basis moet veranderen voordat agentic systemen kunnen opschalen.

Agentic AI verandert data platforms in actiesystemen die contracten en tickets lezen, camera's bekijken, gesprekken beluisteren, correleren met logboeken en gebeurtenissen, en vervolgens uitvoeren. Dashboards kunnen vertragingen verdragen, terwijl agenten dat niet kunnen; compliance kan via documentatie werken, maar agenten hebben controles tijdens runtime nodig. Voordat een onderneming een AI-stack afkondigt, moet er over drie elementen niet onderhandeld worden: multimodaliteit als standaard, streaming als besturingsmodus en governance als runtime-systeem. De volgende secties vertalen deze overtuigingen in architecturale keuzes die agentic workloads op productieschaal dragen.

Multimodaal als standaard

Documenten, afbeeldingen, audio, video en logs behandelen als tweederangs activa beperkt de mogelijkheden van agents door het ontwerp. Een platform dat geschikt is voor agents slaat tabellen en tensors op als peers onder één catalogus met een verenigd lineagesysteem en een consistent toegangsmodel, zodat hoogdimensionale media dezelfde levenscyclus kunnen doorlopen als relationele data. In de praktijk betekent dit chunked of tiled lay-outs die partial reads en region of interest extractie mogelijk maken; content-addressed identifiers met versioned sidecar metadata zodat elk artefact reproduceerbaar is; en array en column native formaten die predicate en coordinate pushdown mogelijk maken. Tekst en documenten vereisen inbeddingen als een primair derivaat die deterministisch gegenereerd worden, in versie zijn met hun bronnen, en geïndexeerd zijn met duidelijke afwegingen, bijvoorbeeld HNSW als herinneren overheerst, IVF PQ als geheugen en latentie in evenwicht moeten zijn, en hybride dichte plus lexicale indexering als productcodes en nummers essentieel zijn. Retrieval moet bewijsmateriaal bundels zoals passages, pagina's, frames of clips teruggeven omdat agenten eerder over bewijsmateriaal redeneren dan over afzonderlijke substrings.

De grootste winst wordt behaald door samenvoeging, maar samenvoeging is alleen waardevol als de uitlijning op platformniveau wordt opgelost. Vroege fusie legt fijnkorrelige interacties vast, zoals het uitlijnen van tekstoverspanningen op beeldregio's, late fusie behoudt modaliteitspecifieke modellen tot een beslissingsgrens, en hybride benaderingen combineren beide als de interactiepunten goed gedefinieerd zijn. Uitlijning is het moeilijke gedeelte. Tijdsynchronisatie van gebeurtenissen tussen bronnen met verschillende bemonsteringsfrequenties, ruimtelijke registratie tussen sensoren en semantische koppeling zodat een order-ID in een PDF, een camerabeeldje van rijstrook drie, een trillingspiek en een grootboekgebeurtenis naar hetzelfde bedrijfsobject leiden, zijn mogelijkheden die in de catalogus- en afstammingslaag thuishoren. Zonder deze gedeelde notie van tijd, identiteit en provenance zullen agenten de context hallucineren of handelen op oudbakken signalen. Aangezien 70% van de leiders gelooft dat de meest waardevolle inzichten in ongestructureerde data zitten, kan multimodaliteit geen fase twee add-on zijn. Het is de standaard die context ontsluit.

Streaming als bedrijfsmodus

Agentwerk introduceert een centrale doelstelling op serviceniveau: beslissingslatentie, de tijd tussen een signaal uit de echte wereld en een aanvaardbare actie. Om aan die doelstelling te voldoen is een streaming first platform nodig. De ruggengraat is een gebeurtenislogboek dat fungeert als recordsysteem, met schema's die worden afgedwongen bij het schrijven en semantiek van gebeurtenistijden met watermerken zodat vensters de zakelijke waarheid weergeven in plaats van de aankomstvolgorde. Op die ruggengraat draaien stateful stream processors die een duurzame lokale toestand handhaven, voorspelbaar omgaan met tegendruk, warme streams verbinden met koude referentie data, en beslissingen uitzenden in plaats van slechts getransformeerde rijen. Om inspectie en rechtvaardiging door zowel mensen als agenten te ondersteunen, plaatst u een realtime analytische laag die rechtstreeks uit het logboek binnenkomt en query's van minder dan een seconde beantwoordt over tabellen die continu worden bijgewerkt.

Het warme pad en het koude pad moeten in dezelfde structuur leven. Land streams in open tabelformaten met ACID-transacties en tijdreizen, zodat replays, backfills, audits en training door kunnen gaan zonder dat de pijplijn bevriest. Hierdoor valt de valse keuze tussen snel en vluchtig aan de ene kant en duurzaam en langzaam aan de andere kant weg. Operationele discipline sluit de lus. Definieer te late budgetten en intrekkingsregels, documenteer replay en dead letter runbooks, en gebruik canary implementaties met gespiegeld verkeer zodat rollouts omkeerbaar zijn. Als deze werkwijzen aanwezig zijn, kunnen fraudeagenten blokkeren voordat er afgerekend wordt, kunnen personaliseringsagenten zich tijdens de sessie aanpassen, kunnen betrouwbaarheidsagenten onderhoud plannen wanneer er voor het eerst drift optreedt en kunnen serviceagenten escaleren wanneer de frustratie toeneemt in plaats van na churn.

Bestuur als runtime-systeem

Naarmate de autonomie toeneemt, wordt vertrouwen de poort. Documentatie en periodieke audits voorkomen geen slechte beslissingen; controle tijdens de runtime doet dat wel. Twee stappen zorgen voor die controle. Ten eerste, dwing data contracten af bij het schrijven, dus producenten publiceren schema's, semantiek en versheidsdoelstellingen, het register blokkeert incompatibele wijzigingen of stuurt ze door naar quarantaine, consumenten geven verwachtingen aan en incidenten worden automatisch gemeld wanneer verwachtingen worden geschonden, zodat agentmachtigingen worden verlaagd totdat de omstandigheden zich herstellen. Ten tweede, evalueer het beleid als code voor elke actie, of deze nu door een mens of een agent wordt uitgevoerd. Wanneer een tool of dataset wordt aangevraagd, moet een beleidsengine evalueren wie er belt, met welk doel, over welke data, onder welk risico en met welke verplichtingen, bijvoorbeeld een bewijsbundel toevoegen, gevoelige velden redigeren of een menselijke medeondertekening boven een drempel vereisen. Het resultaat moet een ondertekende beslissing en een controleerbaar spoor zijn.

Beveiliging heeft een Zero Trust-houding nodig die ervan uitgaat dat elke aanroep wordt geschonden en geverifieerd. Minst bevoorrechte, continue verificatie, sandboxed tooluitvoering en strikte egress-controle zijn de inzet, terwijl agent-specifieke risico's zoals prompt injection, retrieval poisoning en toolmisbruik telemetrie en insluiting tijdens runtime vereisen in plaats van modelgerichte tuning alleen. Uit hetzelfde Salesforce-onderzoek blijkt duidelijk wat er op het spel staat: slechts 43% van de leiders maakt melding van formele governance frameworks, 89% van de teams die AI al gebruiken hebben te maken gehad met onnauwkeurige of misleidende output, en 88% zeggen dat AI nieuwe governance- en beveiligingsbenaderingen vereist. Bewezen governance betekent dat het platform kan laten zien wie er heeft gehandeld, met welke data, onder welk beleid, met welk model of welke toolversie, en hoe het indien nodig kan worden teruggedraaid, wat pilots die indruk maken onderscheidt van systemen die audits overleven.

Hoe de drie elementen samenkomen

De blauwdruk is een levend systeem dat producenten, opslag, computers en beleid met elkaar verbindt zonder handoffs die het vertrouwen aantasten. Producenten zenden change events uit en deponeren artefacten zoals PDF's, afbeeldingen, audio en video in chunked storage terwijl een globale catalogus assets, eigendom, lineage en toepasselijk beleid registreert. Near data pipelines normaliseren, redigeren, embedden en aligneren, en de resulterende features en embeddings stromen naar geïndexeerde stores met gedocumenteerde retrieval profielen. Stateful stream-processors verrijken en beslissen in beweging, en een real-time analytisch oppervlak legt nieuwe feiten bloot aan mensen en agenten. Parallel daaraan komen dezelfde gebeurtenissen terecht in open lakehouse tabellen met ACID semantiek en tijdreizen, zodat realtime en historische overzichten in één beheerd substraat leven. Agenten interageren met elkaar door middel van "narrow least privilege" tools; elke aanroep wordt gecontroleerd door beleid, en elke actie wordt ondertekend en gekoppeld aan afkomst. Dit patroon richt zich op de hiaten in vertrouwen, tijdigheid en toegankelijkheid die schaal blokkeren.

Conclusie

Ondernemingen die AI willen schalen, moeten de drang weerstaan om agentfuncties op een dashboard-era-stack te plakken. De basis moet eerst veranderen. Maak van multimodaliteit de standaard, zodat elk bruikbaar signaal in één catalogus zit met gedeelde identiteit, tijd en afkomst, en zodat het ophalen van gegevens bewijsmateriaal oplevert in plaats van fragmenten. Maak van streaming de bedrijfsmodus, zodat beslissingen de tijd van gebeurtenissen respecteren en binnen een gedefinieerd latentiebudget aankomen, terwijl dezelfde stromen in open tabellen terechtkomen voor controle en leren. Upgrade governance van dia's naar runtime door contracten af te dwingen bij het schrijven, beleidsregels te evalueren bij elke actie, Zero Trust toe te passen op tools en data, en continu te observeren zodat autonomie gepauzeerd of gedowngrade wordt wanneer de kwaliteit achteruit gaat. Samen vervangen deze stappen een rapportagesubstraat door een actiesubstraat. Agenten werken dan op vers multimodaal bewijs binnen expliciete vangrails, met ingebouwde verklaringen, wat is hoe pilots productie worden en hoe AI waarde samenstelt in plaats van uitzonderingen.

Neem contact met ons op

Data Platforms voor het agententijdperk

Auteur