	{"id":70137,"date":"2023-05-15T15:54:06","date_gmt":"2023-05-15T14:54:06","guid":{"rendered":"https:\/\/www.artefact.com\/?post_type=blog&#038;p=70137"},"modified":"2024-09-20T17:45:56","modified_gmt":"2024-09-20T16:45:56","slug":"accelerating-data-literacy-using-machine-learning-data-catalogs","status":"publish","type":"blog","link":"https:\/\/www.artefact.com\/de\/blog\/accelerating-data-literacy-using-machine-learning-data-catalogs\/","title":{"rendered":"Beschleunigung der Data Alphabetisierung durch maschinelles Lernen Data Kataloge"},"content":{"rendered":"<p><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling article-author\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-background-color:#ffffff;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_2 1_2 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:50%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:50%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-1 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Autor<\/h2><\/div><img decoding=\"async\" src=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27150%27%20height%3D%270%27%20viewBox%3D%270%200%20150%200%27%3E%3Crect%20width%3D%27150%27%20height%3D%270%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/04\/john-ly.jpeg\" alt=\"Image\" class=\"lazyload artefact-elegant-image align-left article-author-image\" style=\"width: 150px; border-radius: 54% 46% 77% 23% \/ 74% 40% 60% 26%; overflow: hidden;\" width=\"150\" height=\"auto\" \/><div class=\"fusion-title title fusion-title-2 fusion-sep-none fusion-title-text fusion-title-size-three article-author-name-title\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">John Ly<\/h3><\/div><div class=\"fusion-text fusion-text-1 article-author-description\" style=\"--awb-text-transform:none;\"><p>Senior Berater, Strategie &amp; Data Management, bei Artefact USA<\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-2 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-1 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-text fusion-text-2 description\"><p>Bevor wir uns mit data-Katalogen f\u00fcr maschinelles Lernen (ML) befassen, sollten wir zun\u00e4chst definieren, was ein data-Katalog ist: ein zentrales Repository, das Metadata wie data-Quellen, data-Formate, relationale data-Datenbanken und data-Abstammungen speichert und deren jeweilige Eigent\u00fcmer identifiziert. data-Kataloge gelten weithin als Grundlage einer data-driven-Organisation. Sie f\u00f6rdern die unternehmensweite data-Kompetenz, dienen als einzige Quelle der Wahrheit f\u00fcr die Interpretation und Verwendung von data in der Analytik und f\u00f6rdern data als Produkt durch den Besitz von data-Assets.<\/p>\n<\/div><\/div><\/div><\/div><\/div><article class=\"fusion-fullwidth fullwidth-box fusion-builder-row-3 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-2 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-text fusion-text-3\"><p>W\u00e4hrend <a href=\"https:\/\/www.dataversity.net\/brief-history-data-management\/\" target=\"_blank\" rel=\"noopener\">data-Kataloge gibt es schon seit den 1950er Jahren<\/a>, Der erste ML-gest\u00fctzte data-Katalog, der \u201cAutomated Data Catalog\u201d, wurde erst 2012 von der Unternehmenssoftwarefirma Alation eingef\u00fchrt. Diese automatisierten Kataloge erm\u00f6glichten Funktionen, die heute selbstverst\u00e4ndlich erscheinen, wie z.B. die automatische Metadata-Erfassung, aber sie ebneten den Weg f\u00fcr die hochentwickelten ML data-Kataloge anderer Anbieter, wie Collibra und Atlan.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-3 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Sechs Merkmale, auf die Sie bei einem ML Data Katalog achten sollten<\/h2><\/div><div class=\"fusion-text fusion-text-4\"><p>1. <strong>Automatisierte data Markierung<\/strong>: Die \u201cPrivatadresse\u201d wird automatisch als \u201cPII\u201d gekennzeichnet und in einen sicheren Zugriffsverwaltungspool und eine \u201cKunden\u201d-Dom\u00e4ne data zum Verbrauch sortiert.<\/p>\n<p>2. <strong>KI-unterst\u00fctzte semantische Suche<\/strong>: Durch den Abgleich mit der Suchhistorie kann die ML data Katalogsuche das relevanteste data Asset vorhersagen und die Suche f\u00fcr den Benutzer beschleunigen.<\/p>\n<p>3. <strong>Automatisierte data-Stammbaumkartierung<\/strong>: Erfasst automatisch Transformationen einer Tabelle aus dem System of Record (SOR) in das Dashboard, das f\u00fcr die gesch\u00e4ftliche Nutzung verwendet wird.<\/p>\n<p>4. <strong>Data Qualit\u00e4tsverbesserung<\/strong>: Der ML-Katalog weist auf inkonsistente Formatierungen hin (z.B. \u201cMai 2023\u201d\u2019 statt \u201c20230501\u201d) und macht Vorschl\u00e4ge zur Verbesserung des data.<\/p>\n<p>5. <strong>Automatisiertes data-Profiling<\/strong>: Durch die Analyse der Integration von Liquidit\u00e4t data im gesamten Tech-\u00d6kosystem werden data-Teams bei Finanzinstituten auf potenzielle data-Qualit\u00e4tsprobleme aufmerksam gemacht, die gel\u00f6st werden k\u00f6nnen, um ihre Risikoexposition genau darzustellen.<\/p>\n<p>6.<strong> Data Entdeckung<\/strong>: Wenn eine data-Datenbank mit Metriken zum Verbraucherverhalten in den Katalog integriert wird, klassifizieren ML-Funktionen automatisch die data und beschleunigen die zuk\u00fcnftige Suche.<\/p>\n<p>Mit diesen zus\u00e4tzlichen Funktionen, <strong>Organisationen k\u00f6nnen<\/strong> <strong>organisieren, visualisieren und kontextualisieren Sie ihre data im Ma\u00dfstab<\/strong>, die Qualit\u00e4t der Erkenntnisse zu verbessern und die Zeit bis zur Bereitstellung von Analyseprojekten zu verk\u00fcrzen, die die Entscheidungsfindung auf h\u00f6chster Ebene direkt unterst\u00fctzen.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-4 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Wie k\u00f6nnen ML Data Kataloge die data Alphabetisierung beschleunigen?<\/h2><\/div><div class=\"fusion-text fusion-text-5\"><p>Data-Kenntnisse sind, wie bereits erw\u00e4hnt, der grundlegende Schritt auf dem Weg zu einer data-driven-Organisation. Wenn data-Konsumenten (data-Analysten und -Wissenschaftler, Entscheidungstr\u00e4ger usw.) das data nicht verstehen, ist es nicht besser als ein \u00dcberma\u00df an Speicherplatz, was angesichts der Kosten f\u00fcr die Speicherung von data negativ ist.<\/p>\n<p>ML-gest\u00fctzte data-Kataloge unterst\u00fctzen die data-Kompetenz nicht nur, indem sie die H\u00fcrden f\u00fcr das Erlernen des data beseitigen, sondern vor allem, indem sie es in der Sprache des Unternehmens erl\u00e4utern. Beispielsweise k\u00f6nnen automatisierte data-Tags data-Assets auf der Grundlage verschiedener Elemente in gesch\u00e4ftsspezifische Dom\u00e4nen einordnen und so einen gemeinsamen Nenner liefern, den sowohl ein data-Ingenieur als auch ein Personalleiter nutzen kann. Au\u00dferdem, <strong>wenn Nicht-data-Rollen in der Lage sind, data-Assets zu nutzen, um ihren Output zu verbessern, werden sie sich an data (und den data-Katalog) wenden, wenn sie das n\u00e4chste Mal vor einer \u00e4hnlichen Herausforderung stehen<\/strong>, eine data-kundige und data-driven-kundige Organisation zu schaffen.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-5 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Warum es f\u00fcr den Erfolg wichtig ist, data-kompetent und -orientiert zu sein<\/h2><\/div><div class=\"fusion-text fusion-text-6\"><p>Die Entwicklung zu einem data-driven-Unternehmen ist angesichts des sich schnell entwickelnden Gesch\u00e4ftsumfelds von heute unerl\u00e4sslich. In einer <a href=\"https:\/\/www.ey.com\/en_us\/consulting\/how-companies-are-investing-in-data-and-analytics\" target=\"_blank\" rel=\"noopener\">Forschung<\/a> Studie von Traci Gusher, einem f\u00fchrenden Unternehmen im Bereich data und Analytik (D&amp;A), gaben 93% der Unternehmen an, dass sie ihre Investitionen in D&amp;A-F\u00e4higkeiten weiterhin \u201caggressiv\u201d erh\u00f6hen werden. Allerdings, <a href=\"https:\/\/venturebeat.com\/vb-in-conversation-reimagining-the-data-center-in-todays-environment\/\" target=\"_blank\" rel=\"noopener\">laut Deborah Leff<\/a>, CTO von Data Science and AI bei IBM, kommen 87% der data Wissenschaftsprojekte nie \u00fcber die Planungsphase hinaus, was sich negativ auf die data Ambitionen auswirkt.<\/p>\n<p>Unternehmen aus allen Branchen haben enorme Investitionen get\u00e4tigt, <strong>Die Gewinner werden diejenigen sein, die in der Lage sind, ihren Stakeholdern zu helfen, data-kompetent zu werden.<\/strong>. Der Erfolg bei der Mission, data-driven zu werden, hat gezeigt <a href=\"https:\/\/www.mckinsey.com\/capabilities\/growth-marketing-and-sales\/our-insights\/insights-to-impact-creating-and-sustaining-data-driven-commercial-growth\" target=\"_blank\" rel=\"noopener\">Steigerung des EBITDA um bis zu 25%<\/a>.<\/p>\n<p>Es ist wichtig zu verstehen, dass ein Unternehmen nicht data-driven werden kann, wenn es nicht zuerst die notwendigen Schritte unternommen hat, um data-kompetent zu werden. Wenn Sie Ihren Mitarbeitern eine einzige Quelle der Wahrheit f\u00fcr ihre data zur Verf\u00fcgung stellen, die durch ML-Funktionen unterst\u00fctzt wird, die \u00fcberfl\u00fcssige manuelle Aufgaben wie die Zuordnung von Abstammungslinien, die Zuweisung von data-Tags und -Besitzern und die Erstellung von data-Profilen \u00fcberfl\u00fcssig machen, f\u00f6rdert dies Transparenz und Vertrauen.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-6 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Data Kataloge: ein wichtiger Bestandteil der Entscheidungsfindung<\/h2><\/div><div class=\"fusion-text fusion-text-7\"><p>Das maschinelle Lernen hat data-Kataloge zu einem unverzichtbaren Werkzeug in der heutigen Gesch\u00e4ftswelt gemacht. Die F\u00e4higkeit, komplexe data-Sets durch konsistente \u201cintelligente\u201d Aktionen zu verstehen, erh\u00f6ht die Transparenz, was wiederum das Vertrauen in data-Assets st\u00e4rkt, was zu einer st\u00e4rkeren Nutzung von data f\u00fchrt, mehr Erkenntnisse generiert und ein Endprodukt der data-driven-Entscheidungsfindung hervorbringt.<\/p>\n<\/div><\/div><\/div><\/div><\/article><\/p>","protected":false},"excerpt":{"rendered":"<p>Bevor wir uns mit den data-Katalogen f\u00fcr maschinelles Lernen (ML) befassen, wollen wir zun\u00e4chst definieren, was ein grundlegender data-Katalog ist: ein zentrales Repository, in dem Meta-data gespeichert wird. <\/p>","protected":false},"featured_media":70138,"parent":0,"template":"","meta":{"_acf_changed":false,"ep_exclude_from_search":false},"blog-category":[22035],"blog-language":[2991],"class_list":["post-70137","blog","type-blog","status-publish","has-post-thumbnail","hentry","blog-category-data-ai-consulting","blog-language-en"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/blog\/70137","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/blog"}],"about":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/types\/blog"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/media\/70138"}],"wp:attachment":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/media?parent=70137"}],"wp:term":[{"taxonomy":"blog-category","embeddable":true,"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/blog-category?post=70137"},{"taxonomy":"blog-language","embeddable":true,"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/blog-language?post=70137"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}