In dit artikel legt Pascal Coggia, Managing Partner bij Artefact UK, uit wat Data Mesh is en wat het niet is, waarom het net zo goed een mindset als een benadering is, en wat de use cases, voordelen en uitdagingen zijn.

Wat is Data mesh? Wat is het verschil met een data meer?

De oorspronkelijke bedenker van de term is Zhamak Dehghani, een Thoughtworks consultant en evangelist voor data decentralisatie. Eenvoudig gezegd is Data Mesh een gedistribueerde architectuurbenadering voor het beheer van analytische data. Eindgebruikers kunnen eenvoudig toegang krijgen tot data en deze opvragen op de plaats waar deze zich bevindt, zonder deze eerst naar een data meer of magazijn te transporteren. Een gedecentraliseerde Data Mesh strategie behandelt data als een product en voorziet domeinspecifieke teams van data eigenaarschap door middel van een self-service platform met ingebedde data governance.

Data Meren zijn minimaal beheerde opslagplaatsen voor ruwe domeinen data. Ze waren bedoeld om onbeperkte toegang te bieden tot data in een poging om de bottleneck van gecentraliseerde, strak bestuurde data magazijnen te vermijden, maar ze hadden de neiging om te lijden onder slechte data kwaliteit en vindbaarheidsproblemen. Bepaalde beheerde data meerprojecten hebben deze problemen met enig succes aangepakt, maar ze hebben de neiging om de relatieve toegankelijkheid van de data als resultaat te verminderen. Data Mesh wil deze problemen oplossen door middel van decentralisatie, waardoor deze zogenaamde "data moerassen" volledig vermeden worden.

Wat wordt bedoeld met "data als product"?

Ik zie het een beetje als de app store. Je downloadt gewoon een app als je iets anders wilt doen. Waarom zou dat niet zo zijn met data? Denk er structureel over na: wat zijn de onderdelen van een data product?

  • Het moet vindbaar zijn: mensen moeten het data product kunnen vinden;

  • Het moet aanspreekbaar zijn - mensen moeten weten hoe ze ermee kunnen omgaan;

  • Het moet zichzelf beschrijven;

  • Het moet veilig en betrouwbaar zijn; het moet interoperabiliteit bieden.

Dit alles suggereert dat een data product op een stof zit die interactie mogelijk maakt. Het staat niet op zichzelf. Je kunt niet zomaar wat data bij elkaar gooien en het in een S3 emmer stoppen en het een data product noemen. Je moet er eigenaarschap en bestuur omheen wikkelen.

Wat zijn de voordelen voor bedrijven?

Er zijn veel voordelen die Data Mesh kan bieden aan organisaties en cross-functionele domeinteams:

  • Door data te decentraliseren wordt de snelheid en toegankelijkheid verbeterd, zodat data veel beter vindbaar en consumeerbaar is voor elke gebruiker op organisatie.

  • Omdat teams hun eigen data aan boord hebben en hun eigen data producten beheren, kunnen ze het naar eigen inzicht visualiseren en operationaliseren, wat innovatie stimuleert.

  • De besluitvorming en de time-to-market zullen worden versneld, wat zal leiden tot hogere inkomsten en een betere klantenbinding en -retentie - en uiteindelijk tot lagere kosten.

  • En de bedrijfsflexibiliteit in het algemeen wordt erdoor verbeterd, omdat productmogelijkheden alleen worden ingesteld waar dat nodig is en niet op ondernemingsbasis.

Wat zijn de uitdagingen voor de toepassing van Data Mesh?

Het is belangrijk om te onthouden dat Data Mesh niet alleen een technologische verschuiving vereist, maar ook een mentaliteitsverandering. Organisaties moeten leren denken over data als een product, over data bestuur en eigendom. Het verschuiven van bedrijven van gecentraliseerd naar gedecentraliseerd eigendom en het verschuiven van organisaties van pijplijnen naar producten, waar data domeinen de eerste zorg zijn, zal wat voeten in de aarde hebben.

Enkele andere problemen zijn deze die Deloitte aanhaalt:

  • Duplicatie van data tussen verschillende domeinen: wanneer data opnieuw wordt gebruikt om te voldoen aan de behoeften van een nieuw domein dat verschilt van het brondomein, ontstaan er redundanties die van invloed kunnen zijn op het gebruik van bronnen en de kosten van data beheer.

  • Implementeren van gefedereerde data governance en naleving van kwaliteitsnormen: met onafhankelijke data producten en pijplijnen die naast elkaar bestaan, kunnen kwaliteitsprincipes gemakkelijk over het hoofd worden gezien, wat resulteert in een grote technische schuld. Deze verantwoordelijkheden en principes moeten op de juiste manier geïdentificeerd en gefedereerd worden.

  • Aanzienlijk veranderingsmanagement is vereist: om gedecentraliseerde Data Mesh-operaties in te voeren, zijn aanzienlijke veranderingsmanagementinspanningen nodig.

  • Technologiekeuzes bepalen de totale mogelijkheden van het data platform. Daarom moeten technologiekeuzes die zowel gestandaardiseerd zijn voor de hele organisatie als toekomstbestendig zijn voor alle noodzakelijke data mogelijkheden praktisch worden aangepakt. Verkeerde technologische beslissingen kunnen gemakkelijk resulteren in data producten die de technische schuld na verloop van tijd vergroten.

  • Data Mesh is niet ontworpen om alle bedrijfsbrede data in één rapport te consolideren: Hoewel het overkoepelende doel data toegankelijkheid is, moet er vrijheid zijn binnen een raamwerk. In Data Mesh zijn data eigendom en data vaardigheden verdeeld over cross-functionele domeinteams, zodat belangrijke elementen, zoals een consistent metadataframework en gemeenschappelijke platforms deel blijven uitmaken van een succesvolle implementatie van Data mesh.

Wanneer is een organisatie klaar voor een Data Mesh-strategie?

Het hangt ervan af hoe goed de organisatie is voorbereid. Maar het hangt er ook vanaf met wie je praat. Een Chief Data Officer die een enorme centrale organisatie heeft opgebouwd, is misschien niet klaar voor Data Mesh omdat hij eerst moet vaststellen hoe die functies kunnen worden gefedereerd. Maar de meeste bedrijfsleiders begrijpen de noodzaak om de data asset te democratiseren naar de randen en het bedrijf toe omdat ze vaak gefrustreerd zijn door de gecentraliseerde aanpak.

Je moet ook weten wat er op technisch niveau moet gebeuren om het netwerk te kunnen controleren en besturen, want als je het niet goed instelt, kan het in het Wilde Westen veranderen. Je moet dus een aantal stappen volgen.

  • De eerste stap is het uitvoeren van een architectuurreview om kerncomponenten van een potentiële Data Mesh-architectuur te definiëren die de organisatie al bezit en hoe deze kunnen worden ingezet om mensen in staat te stellen productteams te bouwen.

  • Is er een gecentraliseerd team dat het platform kan creëren waarop de Data Mesh gebouwd zal worden? Dat platform moet er vanaf het begin zijn. De infrastructuur maakt distributief vermogen mogelijk.

  • Ervoor zorgen dat het project de steun en betrokkenheid heeft van het bedrijf en de belanghebbenden om op alle niveaus te slagen.

  • Beschikt het project over de nodige investeringen om de Data Mesh te bouwen en over de capaciteiten om deze te beheren? Want beide zijn essentieel.

  • Als deze stappen zijn voltooid, is het tijd om de productteams te gaan bouwen.

De overgang naar een Data Mesh is een stapsgewijze reis omdat alle elementen die je al hebt - data lakes, data warehouses - moeten worden aangesloten op de Data Mesh, ze kunnen niet worden weggegooid. Mensen willen die informatie en de waarde en governance die er al omheen zit.

Wat voor bedrijven zetten Data Mesh met succes in?

Op dit moment wordt Data Mesh met succes toegepast in de financiële dienstverleningssector. ING is een goed voorbeeld. Het is logisch voor banken om Data Mesh te gebruiken - het ondersteunt een sterkere data governance, dus het services verhoogt de veiligheid. Met Data Mesh hoeven fraudedetectiesystemen geen verbinding te maken met andere systemen en elke dag dezelfde data op te halen. In plaats daarvan kunnen organisaties domeingerichte data producten maken die hun anomaliedetectie-experts kunnen gebruiken om betere modellen en resultaten te creëren.

Zalando, het grootste online platform voor mode in Europa, heeft in 2020 zijn data gedecentraliseerd en zijn enorme data meer veranderd in een Data Mesh. Voor andere sectoren moeten we per geval bekijken hoe het gaat. Want elke business case die je maakt voor Data Mesh zal moeten worden afgestemd op de specifieke uitdagingen van de organisatie - en de sector - en die zijn voortdurend in beweging.

Data Managementstrategieën zijn altijd in beweging en organisaties moeten voorbereid zijn om zich aan te passen aan veranderingen om concurrerend te blijven. Data Mesh is een manier om de silo's van logge monolithische architectuursystemen af te breken en data te decentraliseren voor end-to-end verantwoording en schaalbaarheid. Of Data Mesh geschikt is voor uw bedrijf - of niet, of nog niet - is de vraag.