	{"id":70137,"date":"2023-05-15T15:54:06","date_gmt":"2023-05-15T14:54:06","guid":{"rendered":"https:\/\/www.artefact.com\/?post_type=blog&#038;p=70137"},"modified":"2024-09-20T17:45:56","modified_gmt":"2024-09-20T16:45:56","slug":"accelerating-data-literacy-using-machine-learning-data-catalogs","status":"publish","type":"blog","link":"https:\/\/www.artefact.com\/nl\/blog\/accelerating-data-literacy-using-machine-learning-data-catalogs\/","title":{"rendered":"Versnellen van Data geletterdheid met behulp van Machine Learning Data Catalogi"},"content":{"rendered":"<p><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling article-author\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-background-color:#ffffff;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_2 1_2 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:50%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:50%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-1 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Auteur<\/h2><\/div><img decoding=\"async\" src=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27150%27%20height%3D%270%27%20viewBox%3D%270%200%20150%200%27%3E%3Crect%20width%3D%27150%27%20height%3D%270%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/04\/john-ly.jpeg\" alt=\"Image\" class=\"lazyload artefact-elegant-image align-left article-author-image\" style=\"width: 150px; border-radius: 54% 46% 77% 23% \/ 74% 40% 60% 26%; overflow: hidden;\" width=\"150\" height=\"auto\" \/><div class=\"fusion-title title fusion-title-2 fusion-sep-none fusion-title-text fusion-title-size-three article-author-name-title\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">John Ly<\/h3><\/div><div class=\"fusion-text fusion-text-1 article-author-description\" style=\"--awb-text-transform:none;\"><p>Senior consultant, strategie &amp; Data management, bij Artefact USA<\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-2 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-1 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-text fusion-text-2 description\"><p>Voordat we machine learning (ML) data catalogi gaan onderzoeken, zullen we eerst defini\u00ebren wat een basis data catalogus is: een centrale opslagplaats die metadata opslaat, zoals data bronnen, data formaten, relationele databases en data lineage, en hun respectievelijke eigenaren identificeert. Algemeen beschouwd als de basis van een data-driven organisatie, bevorderen data catalogi bedrijfsbrede data geletterdheid, dienen als een enkele bron van waarheid voor hoe data moet worden ge\u00efnterpreteerd en gebruikt in analyses, en bevorderen data als een product door middel van eigendom van data activa.<\/p>\n<\/div><\/div><\/div><\/div><\/div><article class=\"fusion-fullwidth fullwidth-box fusion-builder-row-3 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-2 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-text fusion-text-3\"><p>Terwijl <a href=\"https:\/\/www.dataversity.net\/brief-history-data-management\/\" target=\"_blank\" rel=\"noopener\">data catalogi bestaan al sinds de jaren 1950<\/a>, De eerste ML-aangedreven data catalogus, de \u201cGeautomatiseerde Data Catalogus\u201d, werd pas in 2012 ge\u00efntroduceerd door bedrijfssoftwarebedrijf Alation. Deze geautomatiseerde catalogi boden mogelijkheden die vandaag de dag vanzelfsprekend lijken, zoals het automatisch vastleggen van metadata, maar ze maakten de weg vrij voor de supercharged ML data catalogi van andere leveranciers, zoals Collibra en Atlan.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-3 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Zes kenmerken die u moet zoeken in een ML Data catalogus<\/h2><\/div><div class=\"fusion-text fusion-text-4\"><p>1. <strong>Geautomatiseerd data markeren<\/strong>: \u201cThuisadres\u201d wordt automatisch getagd als \u201cPII\u201d en gesorteerd in een beveiligde toegangsbeheerpool en een \u201cKlant\u201d data domein voor consumptie.<\/p>\n<p>2. <strong>AI-gestuurd semantisch zoeken<\/strong>: Door te refereren aan de zoekgeschiedenis, voorspelt ML data catalogus zoeken de meest relevante data activa en versnelt het zoeken voor de gebruiker.<\/p>\n<p>3. <strong>Geautomatiseerd in kaart brengen van de data-lijn<\/strong>: Legt automatisch transformaties naar een tabel vast vanuit het System of Record (SOR) naar het dashboard dat gebruikt wordt voor bedrijfsconsumptie.<\/p>\n<p>4. <strong>Data kwaliteitsverbetering<\/strong>: De ML-catalogus identificeert inconsistente opmaak (bijv. \u201cmei 2023\u201d in plaats van \u201920230501\u201c) en geeft suggesties om de data te verbeteren.<\/p>\n<p>5. <strong>Geautomatiseerde data profilering<\/strong>: Door de integratie van liquiditeit data in het hele tech-ecosysteem te analyseren, worden data teams bij financi\u00eble instellingen gewaarschuwd voor potenti\u00eble data kwaliteitsproblemen die opgelost kunnen worden om hun risicoblootstelling nauwkeurig aan te tonen.<\/p>\n<p>6.<strong> Data Ontdekking<\/strong>: Wanneer een database met consumentengedraggegevens in de catalogus wordt ge\u00efntegreerd, classificeren ML-functies de data automatisch en versnellen ze het ophalen in de toekomst.<\/p>\n<p>Met deze extra mogelijkheden, <strong>organisaties kunnen<\/strong> <strong>hun data op schaal organiseren, visualiseren en contextualiseren<\/strong>, Het verbeteren van de kwaliteit van inzichten en het versnellen van de levertijd van analytische projecten die de besluitvorming op topniveau direct ondersteunen.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-4 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Hoe kan ML Data Catalogs data geletterdheid versnellen?<\/h2><\/div><div class=\"fusion-text fusion-text-5\"><p>Data geletterdheid is, zoals eerder gezegd, de fundamentele stap om een data-driven organisatie te worden. Als data consumenten (data analisten en wetenschappers, besluitvormers, etc.) de data niet begrijpen, is het niet beter dan overtollige opslag, een netto negatief effect als je kijkt naar de kosten van het opslaan van data.<\/p>\n<p>ML-aangedreven data catalogi ondersteunen data geletterdheid, niet alleen door het wegnemen van barri\u00e8res voor het leren over de data, maar nog belangrijker, door het uit te leggen in de taal van het bedrijf. Zo kunnen geautomatiseerde data tags data assets organiseren in bedrijfsspecifieke domeinen gebaseerd op verschillende elementen, waardoor een gemeenschappelijke noemer ontstaat die zowel een data engineer als een HR executive kan gebruiken. Bovendien, <strong>wanneer niet-data rollen in staat zijn om gebruik te maken van data middelen om hun output te verbeteren, zullen ze zich wenden tot data (en de data catalogus) de volgende keer dat ze geconfronteerd worden met een soortgelijke uitdaging<\/strong>, op organische wijze een data-geletterde en data-driven-organisatie cre\u00ebren.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-5 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Waarom data-geletterd en -gedreven worden essentieel is voor succes<\/h2><\/div><div class=\"fusion-text fusion-text-6\"><p>Een data-driven organisatie worden is noodzakelijk gezien de snel evoluerende aard van de hedendaagse bedrijfsomgeving. In een <a href=\"https:\/\/www.ey.com\/en_us\/consulting\/how-companies-are-investing-in-data-and-analytics\" target=\"_blank\" rel=\"noopener\">onderzoek<\/a> onderzoek uitgevoerd door Traci Gusher, een data en analytics (D&amp;A) leider, gaf 93% van de bedrijven aan dat ze hun investeringen in D&amp;A capaciteiten \u201cagressief\u201d zouden blijven verhogen. Echter, <a href=\"https:\/\/venturebeat.com\/vb-in-conversation-reimagining-the-data-center-in-todays-environment\/\" target=\"_blank\" rel=\"noopener\">volgens Deborah Leff<\/a>, CTO van Data Wetenschap en AI bij IBM, 87% van de data wetenschappelijke projecten komen nooit verder dan de planningsfase, wat een negatieve invloed heeft op data ambities.<\/p>\n<p>Bedrijven in alle sectoren doen enorme investeringen, <strong>de winnaars zijn degenen die hun belanghebbenden kunnen helpen data-geletterd te worden<\/strong>. Slagen in de missie om data-driven te worden heeft aangetoond <a href=\"https:\/\/www.mckinsey.com\/capabilities\/growth-marketing-and-sales\/our-insights\/insights-to-impact-creating-and-sustaining-data-driven-commercial-growth\" target=\"_blank\" rel=\"noopener\">toename van EBITDA met maximaal 25%<\/a>.<\/p>\n<p>Het is belangrijk om te begrijpen dat een bedrijf niet data-driven kan worden tenzij het eerst de nodige stappen heeft genomen om data-geletterd te worden. Mensen voorzien van \u00e9\u00e9n enkele bron van de waarheid voor hun data, aangedreven door ML mogelijkheden die overbodige handmatige taken verwijderen, zoals lineage mapping, het toewijzen van data tags en eigenaren, en het profileren van data, vergroot de transparantie en het vertrouwen.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-6 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Data Catalogi: een kritisch onderdeel van besluitvorming<\/h2><\/div><div class=\"fusion-text fusion-text-7\"><p>Machine learning heeft data catalogi supercharged en omgevormd tot een essentieel hulpmiddel voor het hedendaagse zakelijke landschap. De mogelijkheid om het giswerk uit het begrijpen van complexe datasets te halen door middel van consistente \u201cintelligente\u201d acties, verhoogt de transparantie, wat vervolgens het vertrouwen in data assets vergroot, wat resulteert in een groter gebruik van data, het genereren van grotere inzichten en het produceren van een eindproduct van data-driven besluitvorming.<\/p>\n<\/div><\/div><\/div><\/div><\/article><\/p>","protected":false},"excerpt":{"rendered":"<p>Voordat we de data-catalogi voor machine learning (ML) gaan verkennen, zullen we eerst defini\u00ebren wat een standaard data-catalogus is: een centrale opslagplaats waarin metadata wordt bewaard. <\/p>","protected":false},"featured_media":70138,"parent":0,"template":"","meta":{"_acf_changed":false,"ep_exclude_from_search":false},"blog-category":[22035],"blog-language":[2991],"class_list":["post-70137","blog","type-blog","status-publish","has-post-thumbnail","hentry","blog-category-data-ai-consulting","blog-language-en"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.artefact.com\/nl\/wp-json\/wp\/v2\/blog\/70137","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.artefact.com\/nl\/wp-json\/wp\/v2\/blog"}],"about":[{"href":"https:\/\/www.artefact.com\/nl\/wp-json\/wp\/v2\/types\/blog"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.artefact.com\/nl\/wp-json\/wp\/v2\/media\/70138"}],"wp:attachment":[{"href":"https:\/\/www.artefact.com\/nl\/wp-json\/wp\/v2\/media?parent=70137"}],"wp:term":[{"taxonomy":"blog-category","embeddable":true,"href":"https:\/\/www.artefact.com\/nl\/wp-json\/wp\/v2\/blog-category?post=70137"},{"taxonomy":"blog-language","embeddable":true,"href":"https:\/\/www.artefact.com\/nl\/wp-json\/wp\/v2\/blog-language?post=70137"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}