
NACHRICHTEN / DATENBERATUNG
28. Oktober 2020
Data-Plattformen haben die Art und Weise revolutioniert, wie Marken data speichern, analysieren und nutzen - aber um sie effizienter zu nutzen, müssen sie damit beginnen, data governance als Code einzubetten, schreiben Justine Nerce, Data Consulting Director, und Jean-Baptiste Charruey, Manager Data Engineering, bei Artefact.
Während sich die globale Wirtschaft von dem ersten Schock des Coronavirus zu erholen beginnt, können wir eine Phase der Konsolidierung und Neubewertung durch die Unternehmen erwarten. Der Bedarf an Innovationen ist jedoch ungebrochen, auch wenn die Budgets knapp sind. Die Einführung neuer Produkte und Dienstleistungen ist nach wie vor mehr als 25% der Gesamteinnahmen und Gewinne ausmacht.
Innovation muss von präzisen, hochwertigen data. Damit dies möglich ist, benötigen Unternehmen jedoch eine Grundlage von leicht zugängliches, dokumentiertes und standardisiertes data, auf das Sie zurückgreifen können. Die Entwicklungszyklen für neue Produkte und Dienstleistungen werden immer kürzer und wettbewerbsfähiger, so dass Unternehmen ihren Ansatz für data weiterentwickeln müssen, um mithalten zu können.
Der Aufstieg des data platform hat den Unternehmen bei der Beschleunigung des Zugangs zum data gute Dienste geleistet, insbesondere denjenigen, die die nächste Generation von KI-Lösungen entwickeln wollen. Es ist jedoch klar, dass Marken heute einen robusteren, effizienteren und qualitativ besseren Ansatz benötigen, um ihre data platforms-Fälle agnostisch zu machen - wartbar, betriebsbereit und skalierbar für jede cloud-, On-Premise- oder Hybrid-Infrastruktur..
Der Aufstieg und Fall des data platform
Unternehmen revolutionieren ständig ihren Umgang mit data, um sich einen Marktvorteil zu verschaffen. Im Laufe der Jahrzehnte sind data-Lagerhäuser - große Lagerstätten mit gefiltertem data - data-Seen gewichen - riesige, zentralisierte Lager mit unraffiniertem rohem data. Doch diese riesigen data-Lager haben sich als unhandlich und schwer zu verwalten erwiesen. Die Vorlaufzeiten verlängerten sich, da es keinen klaren, agilen Prozess gab, um die Entwicklung zu rationalisieren.
Infolgedessen bewegen wir uns von den monolithischen Umgebungen der Vergangenheit hin zu einer stärker verteilten data-Architektur, die auf mehreren data platforms basiert. Dabei handelt es sich um eine Reihe von Software und Diensten, die einen data-See umgeben und dazu beitragen, dass der data besser genutzt werden kann. Unternehmen bauen oft mehrere data platforms für jeden Geschäftsbereich und für jedes neue Projekt auf. Dies bietet Entwicklungsteams folgende Möglichkeiten schnellen Zugang zu den data und den Erkenntnissen, die sie benötigen, um einen neuen Geschäftswert zu schaffen, der ihren aktuellen Bedürfnissen gerecht wird.
Allerdings mit Dezentralisierung führt zu Fragmentierung und Doppelarbeit. Viele Unternehmen investieren viel Zeit und Ressourcen in die Erstellung eines data platform für eine bestimmte Umgebung. Für das nächste Projekt oder den nächsten Anwendungsfall müssen sie dann wieder von vorne anfangen, wobei es je nach den technischen Kenntnissen des Teams zu erheblichen Diskrepanzen kommt. Die Kosten multiplizieren sich um ein Vielfaches, da die Teams bei jedem neuen Projekt praktisch bei Null anfangen.
Ein Großteil der wertvollsten Arbeit, die Unternehmen heute leisten - auch im Zusammenhang mit artificial intelligence - ist abteilungs- und bereichsübergreifend. Qualitativ hochwertiges data muss von Teams und verschiedenen data platforms gemeinsam genutzt werden, um sein volles Potenzial auszuschöpfen. Aber wie können Sie die Qualität aufrechterhalten, wenn data einer Reihe von widersprüchlichen Richtlinien unterworfen ist? Es muss ein Kompromiss gefunden werden zwischen der Möglichkeit für die Teams, das data vor Ort anzupassen und zu gestalten, und der Standardisierung des Ansatzes, um eine solide technologische Basis zu schaffen..
Geben Sie das Netz data ein
Ohne ein Bindegewebe zwischen den verschiedenen Bereichen wird data platforms nicht die Qualität data und die Kosteneffizienz liefern, die Marken für eine schnelle Entwicklung benötigen. Zum Glück gibt es einen Weg, ihren Ansatz weiterzuentwickeln. Sie sollten ihre data-Architektur von einer disparaten Ansammlung von data platforms zu dem weiterentwickeln, was Zhamak Dehghani definiert als ‘data-Netz’.’.
Ein data-Netz ist eine Architektur, in der verteilte data platforms, die sich im Besitz unabhängiger funktionsübergreifender Teams befinden, über ein ‘Netz’ gemeinsamer Richtlinien, Governance und Tools miteinander verbunden sind. Dieser Ansatz bringt Flexibilität und Widerstandsfähigkeit von data platforms durch die Festlegung einer gemeinsamen Basis, während den Teams gleichzeitig die Freiheit gegeben wird, ihre eigene Domain anzupassen.
Dieser Ansatz macht aus einem data platform von einem einmaligen Projekt zu einem langfristigen Vermögenswert, Dadurch werden doppelte Arbeit und unnötige Ressourcenverschwendung vermieden. Der Nachteil des data-Netzes ist jedoch, dass die einzelnen Teams viel Arbeit leisten müssen, um die Industrialisierung abzuschließen. Das kann zeitaufwendig sein und zu einem Ergebnis führen, das alles andere als perfekt ist. Eine Vorlage, die alle Anforderungen an eine produktionsreife Lösung erfüllt, ist der Schlüssel. Doch welche Form sollte diese Vorlage haben?
Die Hauptkomponente ist eine Reihe von gemeinsamen Codes, die für alle data platforms gelten. Dieser ‘data-Sentinel’ ist eine Mischung aus Lösungen, die die Behandlung und Analyse des data und den Übergang zur Industrialisierung erleichtern. Seine Aufgabe ist es, alle data-Flüsse - wie die Sammlung von Metadata und die Bereinigung - durch die Entwicklung von Modulen rund um die data-Qualität und -Dokumentation zu überwachen und zu rationalisieren..
Ein data Sentinel befreit data-Teams und -Spezialisten von den alltäglichen und sich wiederholenden Aufgaben der data-Verwaltung. Stattdessen können sie Konzentration auf strategischere und innovativere Aufgaben, die neue Werte für das Unternehmen schaffen.
Das Herzstück von data Sentinel, data governance als Code, sollte fest in das Plattformdesign eingebettet und bei jedem neuen Anwendungsfall weitergeführt werden. Dank data governance als Code ist data von Anfang an “Eigentum”, von hoher Qualität, dokumentiert, gesichert und konform sowie über data-Modelle im gesamten Unternehmen leicht zugänglich..
Innovation alltäglich machen
Data-Plattformen sollten sein sich entwickelnde Produkte, gedacht für data-Aktivierung und schnellen Geschäftswert. Wenn sie für verschiedene Anwendungsfälle und Anforderungen gemeinsam genutzt werden, sie machen Innovationen und Erfindungen schneller und kostengünstiger. In der Tat kann die Gegenseitigkeit von Diensten die Implementierungsgeschwindigkeit um 40% senken und den Abteilungen helfen, Mehrwert zu schaffen, indem sie die data Qualität und Vielfalt bieten, die sie für ihre Anwendungsfälle benötigen..
Unternehmen müssen ständig neue Anwendungsfälle und Produkte entwickeln, vor allem in der gegenwärtigen Situation. Ein auf Gegenseitigkeit beruhender data governance-als-Code-Ansatz bietet einen End-to-End-Prozess, mit dem sie diese Anwendungsfälle wirklich industrialisieren können. Qualitativ hochwertige, genaue data können über eine robuste, hochgradig schablonenhafte Lösung problemlos zwischen Projekten und Teams ausgetauscht werden. Es wird keine Zeit verschwendet, wenn ein neuer Einblick in ein neues Produkt benötigt wird..
Technologie allein ist nicht genug. Damit das data platform funktioniert, müssen Sie einen Ansatz wählen, der iterativ und transversal ist. Nur so wird Innovation in Ihrem Unternehmen zum Alltag.
Erstmals veröffentlicht von ITPortal.de

BLOG






