	{"id":65852,"date":"2022-01-31T10:48:03","date_gmt":"2022-01-31T10:48:03","guid":{"rendered":"https:\/\/www.artefact.com\/?post_type=news&#038;p=65852"},"modified":"2024-09-20T17:45:48","modified_gmt":"2024-09-20T16:45:48","slug":"data-ml-challenges-for-2022","status":"publish","type":"blog","link":"https:\/\/www.artefact.com\/de\/blog\/data-ml-challenges-for-2022\/","title":{"rendered":"Data &amp; ML Herausforderungen f\u00fcr 2022"},"content":{"rendered":"<p><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling article-author\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-background-color:#ffffff;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_2 1_2 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:50%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:50%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-1 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Autor<\/h2><\/div><img decoding=\"async\" src=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27150%27%20height%3D%270%27%20viewBox%3D%270%200%20150%200%27%3E%3Crect%20width%3D%27150%27%20height%3D%270%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2022\/01\/Bruce-DELATTRE-.png\" alt=\"Image\" class=\"lazyload artefact-elegant-image align-left article-author-image\" style=\"width: 150px; border-radius: 54% 46% 77% 23% \/ 74% 40% 60% 26%; overflow: hidden;\" width=\"150\" height=\"auto\" \/><div class=\"fusion-title title fusion-title-2 fusion-sep-none fusion-title-text fusion-title-size-three article-author-name-title\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Bruce Delattre<\/h3><\/div><div class=\"fusion-text fusion-text-1 article-author-description\"><p>Data Wissenschaftlicher Leiter bei Artefact<\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-2 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-margin-top:40px;--awb-margin-bottom:40px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-center fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-1 fusion_builder_column_1_1 1_1 fusion-flex-column fusion-flex-align-self-center fusion-column-inner-bg-wrapper\" style=\"--awb-padding-top:20px;--awb-padding-right:20px;--awb-padding-bottom:20px;--awb-padding-left:20px;--awb-overflow:hidden;--awb-inner-bg-size:cover;--awb-border-color:rgba(10,17,40,0.1);--awb-border-top:1px;--awb-border-right:1px;--awb-border-bottom:1px;--awb-border-left:1px;--awb-border-style:solid;--awb-border-radius:4px 4px 4px 4px;--awb-inner-bg-border-radius:4px 4px 4px 4px;--awb-inner-bg-overflow:hidden;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><span class=\"fusion-column-inner-bg hover-type-none\"><a class=\"fusion-column-anchor\" href=\"https:\/\/medium.com\/artefact-engineering-and-data-science\/data-ml-challenges-for-2022-a066a4c9e88e\" rel=\"noopener noreferrer\" target=\"_blank\"><span class=\"fusion-column-inner-bg-image\"><\/span><\/a><\/span><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-center fusion-content-layout-row fusion-flex-align-items-center\"><div class=\"fusion-text fusion-text-2\"><p><u>Lesen Sie unseren Artikel \u00fcber<\/u><\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-margin-right:20px;--awb-margin-left:20px;--awb-max-width:150px;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-1 hover-type-none\"><img decoding=\"async\" width=\"4000\" height=\"992\" title=\"Mittel Blog\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog.png\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog.png\" alt class=\"lazyload img-responsive wp-image-60582\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%274000%27%20height%3D%27992%27%20viewBox%3D%270%200%204000%20992%27%3E%3Crect%20width%3D%274000%27%20height%3D%27992%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-200x50.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-400x99.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-600x149.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-800x198.png 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-1200x298.png 1200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog.png 4000w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 4000px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-3\"><p>.<\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-3 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-2 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-text fusion-text-4 description\"><p>Die wichtigsten Trends f\u00fcr 2021 data &amp; ML... und was sie f\u00fcr 2022 bedeuten<\/p>\n<p>Das Jahr 2021 war ziemlich reich an data- und KI-bezogenen Nachrichten. Und was kommt als n\u00e4chstes? In diesem Artikel haben wir einige Geschichten und Blogbeitr\u00e4ge ausgew\u00e4hlt, die wir aufschlussreich fanden. Wir haben einen Schritt zur\u00fcck gemacht und versucht, aus diesen ersten \u201cZeichen\u201d f\u00fcr 2022 zu schlie\u00dfen, was zu erwarten ist.<\/p>\n<p>Dieser Artikel wurde durch die Beitr\u00e4ge von Arthur Derennes, Robin Doumerc, Amale El Hamri, Beno\u00eet Goujon, Vincent Luciani und Hanania Ouazan erm\u00f6glicht.<\/p>\n<\/div><\/div><\/div><\/div><\/div><article class=\"fusion-fullwidth fullwidth-box fusion-builder-row-4 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-3 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-3 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">1 - Z\u00e4hmung der Unanst\u00e4ndigkeit von Stiftungsmodellen<\/h2><\/div><div class=\"fusion-text fusion-text-5\"><p>Das Jahr 2021 hatte seinen Anteil an neuen gro\u00dfen Modellen. Nach GPT-3 (<a href=\"https:\/\/arxiv.org\/abs\/2005.14165\" target=\"_blank\" rel=\"noopener\">Brown et al., 2020<\/a>) im Jahr zuvor, haben Sie vielleicht schon von <a href=\"https:\/\/openai.com\/blog\/clip\/\" target=\"_blank\" rel=\"noopener\">CLIP<\/a> oder, in j\u00fcngerer Zeit, <a href=\"https:\/\/deepmind.com\/blog\/article\/language-modelling-at-scale\" target=\"_blank\" rel=\"noopener\">Gopher<\/a>. Diese \u201cGr\u00fcndungsmodelle\u201d, wie <a href=\"https:\/\/arxiv.org\/abs\/2108.07258\" target=\"_blank\" rel=\"noopener\">Bommasani et al. (2021)<\/a> nennen (da ihre Architektur oft wiederverwendet und leicht ver\u00e4ndert wird, um sie an eine bestimmte Machine Learning-Aufgabe anzupassen, oder da sie auch oft durch Transfer-Lernen weiter verfeinert werden), setzen ihre Reise und ihren Fortschritt fort, da es keine Begrenzung f\u00fcr die Anzahl der Parameter zu geben scheint, die f\u00fcr ihr Training optimiert oder data genutzt werden. <strong>Interessant ist, dass diese Modelle gro\u00dfe Produktivit\u00e4tsgewinne mit sich bringen<\/strong>, Wie Bommasani und seine Mitautoren anmerken, nutzen sie die Kombination von <em>Auftauchen<\/em> und <em>Homogenisierung<\/em>.<\/p>\n<\/div><div class=\"fusion-text fusion-text-6\"><p>Lassen Sie uns mit der Homogenisierung beginnen: <strong>nicht nur, dass die meisten Modelle, die Sie in der Literatur finden, von diesen generischen Architekturen abgeleitet sind <\/strong>(denken Sie an BERT, das heutzutage allgegenw\u00e4rtig ist); <strong>aber oft \u00e4ndern auch Praktiker die Architektur nicht<\/strong>, Sie passen ein vorhandenes \u201cgro\u00dfes\u201d Modell mit Hilfe von Transfer-Lernen an eine nachgelagerte Aufgabe an. Diese \u201cInvarianz\u201d der Architektur bedeutet, dass <strong>neue Verbesserungen an einem Basismodell k\u00f6nnen problemlos in alle seine Untermodelle einflie\u00dfen<\/strong>.<\/p>\n<\/div><div class=\"fusion-text fusion-text-7\"><p>Die n\u00e4chste Entwicklung ergibt sich aus der Art und Weise, wie sie mit dem Training von data umgehen. Sie werden unter Selbstkontrolle geschult und st\u00fctzen sich auf rohes data, das nicht speziell gekennzeichnet wurde. Sie beginnen zu zeigen, dass sie Bed\u00fcrfnisse erf\u00fcllen k\u00f6nnen, f\u00fcr die sie zun\u00e4chst nicht konzipiert wurden (eine \u201cZero-Shot\u201d-F\u00e4higkeit). <strong>Komplexe Aufgaben des maschinellen Lernens, die unter der schlechten Verf\u00fcgbarkeit von data leiden, k\u00f6nnen besser gel\u00f6st werden, indem man das \u201cWissen\u201d nutzt, das diese Modelle aus gro\u00dfen Teilen von data gewinnen.<\/strong>. Wir befinden uns noch im Anfangsstadium und die Ergebnisse sind oft eher beunruhigend als erfolgreich, aber GPT-3 lernt zum Beispiel direkt, eine Aufgabe anhand einer Aufforderung zu l\u00f6sen, die es w\u00e4hrend des Trainings nicht gesehen hat (<em>zumindest theoretisch nicht gesehen haben sollte...<\/em>). <strong>Dieses Aufkommen ungeplanter F\u00e4higkeiten bedeutet, dass wir uns m\u00f6glicherweise zu mehr <\/strong><a href=\"https:\/\/ai.googleblog.com\/2022\/01\/google-research-themes-from-2021-and.html\" target=\"_blank\" rel=\"noopener\">f\u00e4hig und universell einsetzbar<\/a><strong> Maschinelles Lernen. <\/strong><\/p>\n<\/div><div class=\"fusion-text fusion-text-8\"><p>Diese Vorteile sind nicht ohne strukturelle Ver\u00e4nderungen zu haben. Da sie von Natur aus gro\u00df sind, ist die Liste der Organisationen und Unternehmen, die solche Modelle schaffen k\u00f6nnen, begrenzt. <strong>Dies d\u00fcrfte die Nutzung des maschinellen Lernens durch propriet\u00e4re KI-APIs oder prompte Schnittstellen, die das Training und die Wartung von Basismodellen f\u00fcr Ingenieure abstrahieren, definitiv f\u00f6rdern.<\/strong>. Da andererseits mehr Modelle von einem einzigen Elternteil abh\u00e4ngen werden, k\u00f6nnen wir mehr Regulierung, ethische und soziale Untersuchungen dieser Modelle erwarten (da Kinder die Voreingenommenheit ihres Gr\u00fcndungsmodells erben). <strong>Es wird definitiv immer wertvoller werden, mit Talenten zu arbeiten, die die F\u00e4higkeiten, Grenzen und Vorurteile kennen, die sich auf die eine oder andere Weise hinter diesen Schnittstellen verbergen... angefangen bei ihrem CO2-Fu\u00dfabdruck.<\/strong><\/p>\n<\/div><div class=\"fusion-title title fusion-title-4 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">2 - KI nachhaltig gestalten<\/h2><\/div><div class=\"fusion-text fusion-text-9\"><p><strong>Es \u00fcberrascht nicht, dass diese neuen Formen der KI mit hohen Kosten in Form von Kohlenstoffemissionen verbunden sind<\/strong>: <a href=\"https:\/\/arxiv.org\/pdf\/1906.02243.pdf\" target=\"_blank\" rel=\"noopener\">Strubell et al.<\/a> sch\u00e4tzen, dass ein einziges BERT-Training auf GPUs ungef\u00e4hr einem Flug von NY nach SF entspricht, w\u00e4hrend <a href=\"https:\/\/papers.ssrn.com\/sol3\/papers.cfm?abstract_id=3873881\" target=\"_blank\" rel=\"noopener\">Taddeo et al.<\/a> ein einziges GPT-3 Training so viel CO2 ausst\u00f6\u00dft wie 49 Autos in einem Jahr.<\/p>\n<p>KI wurde zun\u00e4chst als wertvolles Werkzeug zur L\u00f6sung von Problemen im Zusammenhang mit dem Klimawandel angesehen (siehe die vielen Ideen aus der NeurIPS-Studie \u201cTackling climate change with machine learning\u201d 2019 <a href=\"https:\/\/www.climatechange.ai\/events\/neurips2019\" target=\"_blank\" rel=\"noopener\">Workshop<\/a>), aber viele Experten verweisen auch auf seine CO2-Bilanz. <strong>\u201c<a href=\"https:\/\/link.springer.com\/article\/10.1007\/s43681-021-00043-6\" target=\"_blank\" rel=\"noopener\">Nachhaltige KI<\/a>\u201d, wie Aimee van Wynsberghe es ausdr\u00fcckt, sollte nicht nur KI f\u00fcr Nachhaltigkeit, sondern auch die Nachhaltigkeit von KI umfassen<\/strong> (die auch nicht auf \u00f6kologische Belange beschr\u00e4nkt sein sollten).<\/p>\n<\/div><div class=\"fusion-text fusion-text-10\"><p>Als Abhishek Gupta <a href=\"https:\/\/thegradient.pub\/sustainable-ai\/\" target=\"_blank\" rel=\"noopener\">empfiehlt<\/a>, arbeiten in <strong>zugunsten einer nachhaltigen KI bedeutet, neue Arbeitsweisen zu erforschen<\/strong>. TinyML k\u00f6nnte <a href=\"https:\/\/arxiv.org\/pdf\/2003.04821.pdf\" target=\"_blank\" rel=\"noopener\">helfen uns, die Energiekosten f\u00fcr drahtlose Berechnungen zu vermeiden<\/a>, w\u00e4hrend <a href=\"https:\/\/electricitymap.org\/\" target=\"_blank\" rel=\"noopener\">Bewusstsein f\u00fcr Kohlenstoff<\/a> sollte uns helfen zu verstehen, an welchem geografischen Ort wir unsere Modelle f\u00fcr maschinelles Lernen am besten trainieren und einsetzen k\u00f6nnen. Auch eine sinnvollere Nutzung der vorhandenen Hardware und Dienste sollte einfach jedermanns Sache sein.<\/p>\n<p><strong>Unabh\u00e4ngig davon, welche L\u00f6sungen f\u00fcr eine nachhaltige KI genutzt werden, erwarten wir, dass Entscheidungstr\u00e4ger eher zweimal nachdenken, bevor sie KI-Projekte starten.<\/strong>. Dies wirft die Herausforderung auf <strong>Messen<\/strong> maschinelles Lernen Auswirkungen auf die Umwelt.<\/p>\n<\/div><div class=\"fusion-text fusion-text-11\"><p>Die Entwicklung des maschinellen Lernens im Jahr 2022 sollte mit einer systematischeren Berichterstattung \u00fcber CO2e neben den Leistungskennzahlen einhergehen (siehe zum Beispiel <a href=\"https:\/\/github.com\/mlco2\/codecarbon\" target=\"_blank\" rel=\"noopener\">codecarbon<\/a>), mehr Transparenz von cloud-Anbietern (siehe GCP Carbon Footprint <a href=\"https:\/\/cloud.google.com\/carbon-footprint\" target=\"_blank\" rel=\"noopener\">Dashboard<\/a>) und vor allem eine tiefere Reflexion \u00fcber die Vorteile und Kosten des Einsatzes von KI. <strong>Die \u00fcberzeugendsten Projekte werden diejenigen sein, die einen ganzheitlichen Ansatz verfolgen: Sie quantifizieren nicht nur den Kohlenstoff-Fu\u00dfabdruck der Computer, sondern stellen ihn der Effizienz gegen\u00fcber, die diese neuen Produkte bieten.<\/strong>, und vergessen Sie nicht, eine m\u00f6gliche <a href=\"https:\/\/en.wikipedia.org\/wiki\/Rebound_effect_(conservation)\" target=\"_blank\" rel=\"noopener\">Rebound-Effekt<\/a>. Die Messung des CO2-Fu\u00dfabdrucks dieser gro\u00dfen Modelle ist nicht genug: <strong>wir sollten die gesamte End-to-End-Pipeline ber\u00fccksichtigen: Schulung, Einsatz, \u00dcberwachung und auch die Auswirkungen auf die Arbeitsweise der Menschen<\/strong>.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-5 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">3 - Verleihen Sie Ihren MLOPs einen Hauch von Zen<\/h2><\/div><div class=\"fusion-text fusion-text-12\"><p><strong>Dies ist wichtig, da die Produktionsseite des maschinellen Lernens immer komplizierter und anspruchsvoller wird.<\/strong>. Die MLOPs haben in diesem Jahr besonders geboomt und hatten ihren Anteil an Neuerungen oder brisanten Konzepten wie Matt Turck <a href=\"https:\/\/mattturck.com\/data2021\/\" target=\"_blank\" rel=\"noopener\">erkl\u00e4rt<\/a>. Denken Sie einfach an <a href=\"https:\/\/data-notes.co\/what-i-learned-from-attending-tectons-apply-conference-85635a03ff2e\" target=\"_blank\" rel=\"noopener\">bietet Gesch\u00e4fte<\/a>, <a href=\"https:\/\/www.reuters.com\/business\/confluent-targets-over-8-bln-valuation-us-ipo-2021-06-16\/\" target=\"_blank\" rel=\"noopener\">Streaming<\/a> F\u00e4higkeiten und alle DataOps-Initiativen, die wir weiter unten behandeln werden.<\/p>\n<p>W\u00e4hrend das Jahr 2021 erneut ein Boomjahr f\u00fcr <a href=\"https:\/\/ml-ops.org\/content\/motivation#mlops-definition\" target=\"_blank\" rel=\"noopener\">MLOPs<\/a>, haben wir auch begonnen, die <strong>Zeuge nachdenklicher Kritik an seiner eigenen Begeisterung<\/strong>. Und die Argumente sind fair: Die MLOPs-Landschaft ist <a href=\"https:\/\/mattturck.com\/data2021\/\" target=\"_blank\" rel=\"noopener\">kaum lesbar,<\/a> die Hunderte von Konzepten und Tools umfasst, vielleicht oft <a href=\"https:\/\/laszlo.substack.com\/p\/whats-wrong-with-mlops\" target=\"_blank\" rel=\"noopener\">overkilling<\/a> es, und <strong>k\u00f6nnte man vern\u00fcnftigerweise argumentieren, dass ein durchschnittliches Projekt <a href=\"https:\/\/en.wikipedia.org\/wiki\/You_aren%27t_gonna_need_it\" target=\"_blank\" rel=\"noopener\">werden nicht unbedingt alle ben\u00f6tigen<\/a><\/strong>. Die Mehrheit der \u201c<a href=\"https:\/\/towardsdatascience.com\/mlops-without-much-ops-d17f502f76e8\" target=\"_blank\" rel=\"noopener\">angemessener Umfang<\/a>\u201d Unternehmen, die nicht <a href=\"https:\/\/towardsdatascience.com\/ml-and-mlops-at-a-reasonable-scale-31d2c0782d9c\" target=\"_blank\" rel=\"noopener\">FAANG<\/a> (<em>d.h.<\/em> keine riesigen technischen Teams, kein unendlicher ROI durch KI, vern\u00fcnftige data-Volumen) <strong>sollte es einfach halten<\/strong>.<\/p>\n<\/div><div class=\"fusion-text fusion-text-13\"><p><strong>Es bleibt schwierig vorherzusagen, wie sich diese Landschaft weiterentwickeln wird<\/strong>Ohne Zweifel sollten wir erwarten, dass mehr Startups auf den Plan treten, aber auch eine gewisse Homogenisierung und Konsolidierung hinter den gro\u00dfen Playern. No- oder Low-Code-Tools werden sicherlich weiter wachsen und diese Funktionen f\u00fcr alle verf\u00fcgbar machen. Wie auch immer die Dinge sich entwickeln werden, <strong>wir glauben auch fest daran, dass sich in den n\u00e4chsten Jahren offene Standards und ein \u201ckanonischer ML-Stack\u201d herausbilden werden\u201d<\/strong> wie die, die die AI Infrastructure Alliance beabsichtigt <a href=\"https:\/\/towardsdatascience.com\/ml-and-mlops-at-a-reasonable-scale-31d2c0782d9c\" target=\"_blank\" rel=\"noopener\">bauen<\/a> (Haftungsausschluss: Artefact ist Teil der Allianz).<\/p>\n<\/div><div class=\"fusion-text fusion-text-14\"><p><strong>Deshalb m\u00f6chten wir, dass Sie einen Hauch von <a href=\"https:\/\/en.wikipedia.org\/wiki\/Zen\" target=\"_blank\" rel=\"noopener\">Zen<\/a> zu Ihren MLOPs im Jahr 2022<\/strong>. Es bedeutet erstens, einen Schritt zur\u00fcckzutreten und <strong>Ihren Stapel auf das Wesentliche reduzieren<\/strong>: die Effizienz Ihrer maschinellen Lernmodelle und die Produktivit\u00e4t Ihrer data-Wissenschaftler, zum Beispiel mit einer \u201c<a href=\"https:\/\/multithreaded.stitchfix.com\/blog\/2021\/02\/09\/aggressively-helpful-platform-teams\/\" target=\"_blank\" rel=\"noopener\">aggressiv hilfreich<\/a>\u201dMentalit\u00e4t wie die, die das Stitch Fix Plattformteam \u00fcbernommen hat. Dann, wie die meisten der <a href=\"https:\/\/arxiv.org\/pdf\/2107.00079.pdf\" target=\"_blank\" rel=\"noopener\">Antipatterns<\/a> eines Machine Learning-Projekts scheinen von der data-Seite zu kommen,<strong> an der Konsolidierung der Grundlagen Ihres Projekts zu arbeiten: wie Sie das data selbst beziehen und verarbeiten<\/strong>. Wie Ciro Greco es ausdr\u00fcckt, sollte data in der Tat zu einem \u201c<a href=\"https:\/\/towardsdatascience.com\/hagakure-for-mlops-the-four-pillars-of-ml-at-reasonable-scale-5a09bd073da\" target=\"_blank\" rel=\"noopener\">Staatsb\u00fcrger erster Klasse<\/a>\u201d Ihres Produktionsstapels.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-6 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">4 - Das data ist mehr ein Produkt als eine einfache Eingabe<\/h2><\/div><div class=\"fusion-text fusion-text-15\"><p>\u201cEs ging schon immer um data\u201d sollte das Jahr 2021 erkl\u00e4ren, mit seinem erneuten Interesse daran, was nat\u00fcrlich auch durch die Tatsache belegt wird, dass <a href=\"https:\/\/www.forbes.com\/sites\/gilpress\/2021\/06\/16\/andrew-ng-launches-a-campaign-for-data-centric-ai\/?sh=3b1e4c3c74f5\" target=\"_blank\" rel=\"noopener\">Data-Zentrale KI<\/a> Bewegung, die von Andrew Ng ins Leben gerufen wurde. <strong>data ist nicht nur der Treibstoff f\u00fcr die Leistung Ihres Modells f\u00fcr maschinelles Lernen, sondern auch der Punkt, an dem die Probleme auftreten, denn unausgewogenes, verzerrtes oder schlecht etikettiertes data wird sich definitiv nachteilig auf nachgeschaltete Algorithmen auswirken.<\/strong>. F\u00fcr ein bestimmtes &amp; festes Modell sollten wir also in der Lage sein, die Qualit\u00e4t zu verbessern, indem wir einfach an seinem Input, dem data, arbeiten.<\/p>\n<\/div><div class=\"fusion-text fusion-text-16\"><p>Interessant ist, dass diese Bewegung alle entlang der Wertsch\u00f6pfungskette in Einklang bringen sollte, von der data-Ingenieurseite und ihren j\u00fcngsten Aufrufen zur Pflege der <a href=\"https:\/\/databand.ai\/data-observability\/\" target=\"_blank\" rel=\"noopener\">DataOps<\/a> Praktiken (und wir selbst haben in diesem Jahr mit gro\u00dfer Freude Tools wie <a href=\"https:\/\/greatexpectations.io\/\" target=\"_blank\" rel=\"noopener\">Gro\u00dfe Erwartungen<\/a> in all unseren Projekten) an die data-Wissenschaftler und -Analysten, denen es nicht an anspruchsvollen <a href=\"https:\/\/datacentricai.org\/\" target=\"_blank\" rel=\"noopener\">Methodologien<\/a> um das vorliegende data zu verfeinern (Vergr\u00f6\u00dferung, Kennzeichnung, Korrektur von Verzerrungen, Stichproben...). <strong>Nat\u00fcrlich sind wir der Meinung, dass dies nicht ohne eine klare Investition seitens des oberen Managements und die Anwendung von expliziten <a href=\"https:\/\/marketing.artefact.com\/l\/597421\/2021-12-20\/hwlcq2?utm_source=ebook&amp;utm_medium=website&amp;utm_campaign=2021-11-FR-Ebook-Data-Governance\" target=\"_blank\" rel=\"noopener\">Prozesse<\/a> von data governance, um die verschiedenen Bereiche und ihre Eigent\u00fcmer innerhalb der Organisation zun\u00e4chst zu identifizieren und dann zu strukturieren. <\/strong><\/p>\n<\/div><div class=\"fusion-text fusion-text-17\"><p>Dies und die Tatsache, dass das data dank Initiativen wie <a href=\"https:\/\/consent.yahoo.com\/v2\/collectConsent?sessionId=3_cc-session_7581c65a-5999-46c3-9a14-3b8bc2674d2f\" target=\"_blank\" rel=\"noopener\">Airbyte's<\/a> und die kontinuierliche Verbesserung der <a href=\"https:\/\/databricks.com\/blog\/2021\/05\/26\/introducing-delta-sharing-an-open-protocol-for-secure-data-sharing.html\" target=\"_blank\" rel=\"noopener\">data teilen<\/a> Technologien in unserem modernen data-Stack w\u00fcrde es erm\u00f6glichen<strong> Unternehmen offensichtlich, um neue <a href=\"https:\/\/towardsdatascience.com\/the-future-of-the-modern-data-stack-2de175b3c809\" target=\"_blank\" rel=\"noopener\">Perspektiven<\/a> vom data selbst<\/strong>, parallel zu dem, was KI bereits in Bezug auf Automatisierung und Erkenntnisse bringt.<\/p>\n<\/div><div class=\"fusion-text fusion-text-18\"><p>***<\/p>\n<p>Das war's! In dieser Zeit der Neujahrsvors\u00e4tze w\u00fcnschen wir Ihnen also, dass Sie die Unanst\u00e4ndigkeit der Basismodelle z\u00e4hmen, die KI nachhaltig machen, Ihren MLOPs einen Hauch von Zen verleihen und schlie\u00dflich Ihr data als Produkt pflegen, anstatt es nur als Input zu betrachten. Und Sie?<strong> Was hat Sie im letzten Jahr am meisten \u00fcberrascht? Was erwarten Sie, was dieses Jahr passieren wird?\u00a0<\/strong><\/p>\n<\/div><\/div><\/div><\/div><\/article><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-5 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-margin-top:40px;--awb-margin-bottom:40px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-center fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-4 fusion_builder_column_1_1 1_1 fusion-flex-column fusion-flex-align-self-center fusion-column-inner-bg-wrapper\" style=\"--awb-padding-top:40px;--awb-padding-right:40px;--awb-padding-bottom:40px;--awb-padding-left:40px;--awb-overflow:hidden;--awb-inner-bg-position:left center;--awb-inner-bg-size:cover;--awb-border-color:rgba(10,17,40,0.1);--awb-border-style:solid;--awb-border-radius:4px 4px 4px 4px;--awb-inner-bg-border-radius:4px 4px 4px 4px;--awb-inner-bg-overflow:hidden;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><span class=\"fusion-column-inner-bg hover-type-none\"><a class=\"fusion-column-anchor\" href=\"https:\/\/medium.com\/artefact-engineering-and-data-science\/data-ml-challenges-for-2022-a066a4c9e88e\" target=\"_blank\" rel=\"noopener\"><span class=\"fusion-column-inner-bg-image lazyload\" data-bg=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/background.jpg\"><\/span><\/a><\/span><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-center fusion-content-layout-column fusion-column-has-bg-image\" data-bg-url=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/background.jpg\"><div class=\"fusion-image-element\" style=\"text-align:center;--awb-margin-right:20px;--awb-margin-left:20px;--awb-max-width:150px;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-2 hover-type-none\"><img decoding=\"async\" width=\"72\" height=\"41\" title=\"mittel\" src=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%2772%27%20height%3D%2741%27%20viewBox%3D%270%200%2072%2041%27%3E%3Crect%20width%3D%2772%27%20height%3D%2741%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/medium.png\" alt class=\"lazyload img-responsive wp-image-60927\"\/><\/span><\/div><div class=\"fusion-title title fusion-title-7 fusion-sep-none fusion-title-center fusion-title-text fusion-title-size-three\" style=\"--awb-margin-top:20px;--awb-margin-bottom:0px;--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-center fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Mittel Blog von Artefact.<\/h3><\/div><div class=\"fusion-text fusion-text-19\" style=\"--awb-content-alignment:center;\"><p>Dieser Artikel wurde urspr\u00fcnglich ver\u00f6ffentlicht auf <strong>Medium.com<\/strong>.<br \/>\nFolgen Sie uns auf unserem Medium Blog !<\/p>\n<\/div><div style=\"text-align:center;\"><a class=\"fusion-button button-flat button-medium button-default fusion-button-default button-1 fusion-button-default-span fusion-button-default-type\" target=\"_blank\" rel=\"noopener noreferrer\" href=\"https:\/\/medium.com\/artefact-engineering-and-data-science\/data-ml-challenges-for-2022-a066a4c9e88e\"><span class=\"fusion-button-text awb-button__text awb-button__text--default\">Unseren Artikel lesen<\/span><\/a><\/div><\/div><\/div><\/div><\/div><\/p>","protected":false},"excerpt":{"rendered":"<p>Die wichtigsten Trends f\u00fcr 2021 data &amp; ML... und was sie f\u00fcr 2022 bedeuten<\/p>","protected":false},"featured_media":68685,"parent":0,"template":"","meta":{"_acf_changed":false,"ep_exclude_from_search":false},"blog-category":[21939],"blog-language":[2991],"class_list":["post-65852","blog","type-blog","status-publish","has-post-thumbnail","hentry","blog-category-medium","blog-language-en"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/blog\/65852","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/blog"}],"about":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/types\/blog"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/media\/68685"}],"wp:attachment":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/media?parent=65852"}],"wp:term":[{"taxonomy":"blog-category","embeddable":true,"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/blog-category?post=65852"},{"taxonomy":"blog-language","embeddable":true,"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/blog-language?post=65852"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}