{"id":49861,"date":"2021-03-08T13:20:33","date_gmt":"2021-03-08T13:20:33","guid":{"rendered":"https:\/\/www.artefact.com\/?post_type=news&#038;p=49861"},"modified":"2024-09-20T17:45:39","modified_gmt":"2024-09-20T16:45:39","slug":"sales-forecasting-in-retail-what-we-learned-from-the-m5-competition-published-in-medium-tech-blog","status":"publish","type":"blog","link":"https:\/\/www.artefact.com\/de\/blog\/sales-forecasting-in-retail-what-we-learned-from-the-m5-competition-published-in-medium-tech-blog\/","title":{"rendered":"Umsatzprognosen im Einzelhandel: Was wir aus dem M5-Wettbewerb gelernt haben"},"content":{"rendered":"<p><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-text fusion-text-1 description\"><p>5. Februar 2021<br \/>\nIn diesem Artikel fasst Data-Wissenschaftler Maxime Lutel seine Erkenntnisse aus dem M5-Wettbewerb f\u00fcr Umsatzprognosen zusammen, bei dem es darum ging, die zuk\u00fcnftigen Ums\u00e4tze in mehreren Walmart-Filialen vorherzusagen. Er f\u00fchrt Sie durch unsere L\u00f6sung und erl\u00e4utert, welches maschinelle Lernmodell f\u00fcr diese Aufgabe am besten geeignet war.<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-1 hover-type-none\"><img decoding=\"async\" width=\"300\" height=\"74\" title=\"Mittel Blog\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog.png\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-300x74.png\" alt class=\"lazyload img-responsive wp-image-60582\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%274000%27%20height%3D%27992%27%20viewBox%3D%270%200%204000%20992%27%3E%3Crect%20width%3D%274000%27%20height%3D%27992%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-200x50.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-400x99.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-600x149.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-800x198.png 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-1200x298.png 1200w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 300px\" \/><\/span><\/div><\/div><\/div><\/div><\/div><article class=\"fusion-fullwidth fullwidth-box fusion-builder-row-2 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-1 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-1 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Mit maschinellem Lernen die gesch\u00e4ftlichen Herausforderungen des Einzelhandels l\u00f6sen<\/h2><\/div><div class=\"fusion-text fusion-text-2\"><p>Genaue Absatzprognosen sind f\u00fcr Einzelhandelsunternehmen entscheidend, um die ben\u00f6tigte Menge zum richtigen Zeitpunkt zu produzieren. Aber auch wenn die Vermeidung von Verschwendung und Knappheit eines ihrer Hauptanliegen ist, haben Einzelh\u00e4ndler noch viel Raum f\u00fcr Verbesserungen. Zumindest denken das die Mitarbeiter von Walmart, die im M\u00e4rz 2020 einen offenen data-Wissenschaftswettbewerb gestartet haben. <a href=\"https:\/\/www.kaggle.com\/c\/m5-forecasting-accuracy\/overview\" target=\"_blank\" rel=\"noopener\">der M5 Wettbewerb<\/a>\u00a0- um zu sehen, wie sie ihre Prognosemodelle verbessern k\u00f6nnen.<\/p>\n<p>Ziel des Wettbewerbs war die Vorhersage zuk\u00fcnftiger Verk\u00e4ufe auf Produktebene, basierend auf historischen data. Mehr als 5000 Teams von data-Liebhabern und Prognoseexperten haben monatelang \u00fcber die Methoden, Funktionen und Modelle diskutiert, die am besten geeignet sind, um dieses bekannte Problem des maschinellen Lernens zu l\u00f6sen. Diese Debatten haben einige wiederkehrende Probleme aufgezeigt, die bei fast allen Prognoseprojekten auftreten. Und, was noch wichtiger ist, sie brachten eine Vielzahl von Ans\u00e4tzen hervor, um sie zu l\u00f6sen.<\/p>\n<p>Dieser Artikel versucht, einige Informationen zusammenzufassen\u00a0<strong>Die wichtigsten Erkenntnisse, die sich aus der Herausforderung ergeben haben<\/strong>. Bei Artefact glauben wir an \"Learning by doing\", also haben wir beschlossen, einen Versuch zu wagen und unsere eigene L\u00f6sung zu programmieren, um dies zu veranschaulichen. Lassen Sie uns nun die gesamte Prognose-Pipeline durchgehen und unterwegs anhalten, um zu verstehen, was funktioniert hat und was nicht.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-2 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Problemstellung: Hierarchische Zeitreihenprognose<\/h2><\/div><div class=\"fusion-text fusion-text-3\"><p>Das dataset enth\u00e4lt historische 5-Jahres-Verk\u00e4ufe von 2011 bis 2016 f\u00fcr verschiedene Produkte und Gesch\u00e4fte. Es enth\u00e4lt einige zus\u00e4tzliche Informationen, wie Verkaufspreise und Kalenderereignisse. Data ist hierarchisch aufgebaut: Die Filialen sind in 3 Staaten unterteilt und die Produkte sind nach Kategorien und Unterkategorien gruppiert.<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-2 hover-type-none\"><img decoding=\"async\" width=\"700\" height=\"424\" title=\"Bild-1-\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/Image-1-.png\" data-orig-src=\"https:\/\/www.artefact.com\/wp-content\/uploads\/2021\/03\/Image-1-.png\" alt class=\"lazyload img-responsive wp-image-54226\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27700%27%20height%3D%27424%27%20viewBox%3D%270%200%20700%20424%27%3E%3Crect%20width%3D%27700%27%20height%3D%27424%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/Image-1--200x121.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/Image-1--400x242.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/Image-1--600x363.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/Image-1-.png 700w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 700px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-4\"><p>Unsere Aufgabe ist es\u00a0<strong>Vorhersage der Ums\u00e4tze f\u00fcr alle Produkte in jeder Filiale, an den Tagen direkt nach dem verf\u00fcgbaren dataset<\/strong>. Das bedeutet, dass f\u00fcr jeden Tag des Prognosehorizonts 30 490 Prognosen erstellt werden m\u00fcssen.<\/p>\n<p>Diese Hierarchie wird unsere Modellierungsentscheidungen leiten, denn die Interaktionen innerhalb von Produktkategorien oder Gesch\u00e4ften enthalten sehr n\u00fctzliche Informationen f\u00fcr Vorhersagezwecke. Artikel in denselben Gesch\u00e4ften und Kategorien k\u00f6nnen n\u00e4mlich eine \u00e4hnliche Umsatzentwicklung aufweisen oder sich im Gegenteil gegenseitig kannibalisieren. Daher werden wir jede Stichprobe durch Merkmale beschreiben, die diese Interaktionen erfassen, und\u00a0<strong>dem maschinellen Lernen den Vorzug vor traditionellen Prognosen geben<\/strong>, um diese Informationen beim Training des Modells zu ber\u00fccksichtigen.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-3 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Zwei gro\u00dfe Herausforderungen: intermittierende Werte und ein erweiterter Vorhersagehorizont<\/h2><\/div><div class=\"fusion-text fusion-text-5\"><p>In diesem Stadium denken Sie vielleicht, dass es sich um ein ganz gew\u00f6hnliches Prognoseproblem handelt. Sie haben Recht und genau deshalb ist es interessant: Es kann sich auf eine Vielzahl anderer Projekte beziehen, auch wenn jede Branche ihre eigenen Merkmale hat. Allerdings weist diese Herausforderung 2 wichtige Besonderheiten auf, die die Aufgabe schwieriger machen als erwartet.<\/p>\n<p>Die erste ist, dass die Zeitreihen, mit denen wir arbeiten, viele intermittierende Werte aufweisen, d.h. lange Zeitr\u00e4ume von aufeinanderfolgenden Tagen ohne Verk\u00e4ufe, wie in der folgenden Grafik dargestellt. Dies k\u00f6nnte auf Lagerausf\u00e4lle oder begrenzte Regalfl\u00e4chen in den Gesch\u00e4ften zur\u00fcckzuf\u00fchren sein. In jedem Fall erschwert dies die Aufgabe, da der Fehler in die H\u00f6he schie\u00dft, wenn die Verk\u00e4ufe auf einem regelm\u00e4\u00dfigen Niveau vorhergesagt werden, w\u00e4hrend das Produkt nicht in den Regalen liegt.<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-3 hover-type-none\"><img decoding=\"async\" width=\"700\" height=\"355\" title=\"Bild-2-\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-2-.png\" data-orig-src=\"https:\/\/www.artefact.com\/wp-content\/uploads\/2021\/03\/image-2-.png\" alt class=\"lazyload img-responsive wp-image-54231\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27700%27%20height%3D%27355%27%20viewBox%3D%270%200%20700%20355%27%3E%3Crect%20width%3D%27700%27%20height%3D%27355%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-2--200x101.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-2--400x203.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-2--600x304.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-2-.png 700w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 700px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-6\"><p>Die zweite kommt von der Aufgabe selbst, genauer gesagt von der\u00a0<strong>Gr\u00f6\u00dfe des Vorhersagehorizonts<\/strong>. Die Wettbewerber m\u00fcssen Prognosen nicht nur f\u00fcr die n\u00e4chste Woche, sondern f\u00fcr einen Zeitraum von 4 Wochen erstellen. W\u00fcrden Sie sich lieber auf die Wettervorhersage f\u00fcr den n\u00e4chsten Tag oder f\u00fcr 1 Monat verlassen? Das Gleiche gilt f\u00fcr die Absatzprognose: Ein l\u00e4ngerer Prognosehorizont macht das Problem komplexer, da die Unsicherheit mit der Zeit zunimmt.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-4 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Feature Engineering - Modellierung der verkaufsf\u00f6rdernden Faktoren<\/h2><\/div><div class=\"fusion-text fusion-text-7\"><p>Jetzt, da wir die Aufgabe verstanden haben, k\u00f6nnen wir mit der Berechnung von Merkmalen beginnen, die alle Ph\u00e4nomene modellieren, die die Umsatzentwicklung beeinflussen k\u00f6nnten. Das Ziel besteht darin, jedes Triplett Tag x Produkt x Gesch\u00e4ft durch eine Reihe von Indikatoren zu beschreiben, die die Auswirkungen von Faktoren wie Saisonalit\u00e4t, Trends oder Preisgestaltung erfassen.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-5 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Saisonalit\u00e4t<\/h2><\/div><div class=\"fusion-text fusion-text-8\"><p>Anstatt das Verkaufsdatum direkt als Pr\u00e4diktor zu verwenden, ist es in der Regel sinnvoller, es in mehrere Merkmale zu zerlegen, um die Saisonalit\u00e4t zu charakterisieren: Jahr, Monat, Wochennummer,\u00a0<strong>Tag der Woche<\/strong>... Letzteres ist besonders aufschlussreich, weil das Problem eine starke w\u00f6chentliche Periodizit\u00e4t aufweist: Die Verkaufsmengen sind an den Wochenenden gr\u00f6\u00dfer, wenn die Menschen mehr Zeit in den Superm\u00e4rkten verbringen.<\/p>\n<p><strong>Kalender Ereignisse<\/strong>\u00a0wie Feiertage oder das NBA-Finale haben ebenfalls einen starken saisonalen Einfluss. F\u00fcr jedes Ereignis wurde ein Merkmal mit den folgenden Werten erstellt:<\/p>\n<\/div><ul style=\"--awb-line-height:27.2px;--awb-icon-width:27.2px;--awb-icon-height:27.2px;--awb-icon-margin:11.2px;--awb-content-margin:38.4px;\" class=\"fusion-checklist fusion-checklist-1 fusion-checklist-default type-icons\"><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Negative Werte f\u00fcr die 15 Tage vor dem Ereignis (-15 bis -1)<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>0 am D-Tag<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">Positive Werte f\u00fcr die 15 Tage nach dem Ereignis (1 bis 15)<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">Kein Wert f\u00fcr Zeitr\u00e4ume, die mehr als 15 Tage vor dem Ereignis liegen<\/div><\/li><\/ul><div class=\"fusion-text fusion-text-9\"><p>Die Idee ist, die saisonalen Auswirkungen nicht nur am D-Day, sondern auch davor und danach zu modellieren. Zum Beispiel wird ein Produkt, das h\u00e4ufig als Weihnachtsgeschenk angeboten wird, in den Tagen davor eine Verkaufsspitze und direkt danach einen R\u00fcckgang erleben.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-6 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Trends<\/h2><\/div><div class=\"fusion-text fusion-text-10\"><p>Die j\u00fcngsten Trends liefern auch n\u00fctzliche Informationen \u00fcber zuk\u00fcnftige Verk\u00e4ufe und werden dank der\u00a0<strong>Lag-Funktionen<\/strong>. Eine Verz\u00f6gerung ist der Wert der Zielvariablen, der um einen bestimmten Zeitraum verschoben wird. F\u00fcr einen bestimmten Artikel in einem bestimmten Gesch\u00e4ft w\u00e4re der 1-Wochen-Verz\u00f6gerungswert der Umsatz, der vor einer Woche f\u00fcr diesen Artikel und dieses Gesch\u00e4ft erzielt wurde. Es k\u00f6nnen verschiedene Verschiebungswerte ber\u00fccksichtigt werden, und es wird auch der Durchschnitt mehrerer Verz\u00f6gerungen berechnet, um robustere Pr\u00e4diktoren zu erhalten. Verz\u00f6gerungen k\u00f6nnen auch f\u00fcr aggregierte Ums\u00e4tze berechnet werden, um globalere Trends zu erfassen, z. B. auf Ebene der Filiale oder der Produktkategorie.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-7 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Preisgestaltung<\/h2><\/div><div class=\"fusion-text fusion-text-11\"><p>Der Preis eines Produkts kann sich von einem Gesch\u00e4ft zum anderen und sogar von einer Woche zur anderen innerhalb desselben Gesch\u00e4fts \u00e4ndern. Diese Schwankungen haben einen starken Einfluss auf den Verkauf und sollten daher durch einige Merkmale beschrieben werden. Anstelle von absoluten Preisen,\u00a0<strong>relative Preisunterschiede zwischen relevanten Produkten erkl\u00e4ren eher die Umsatzentwicklung<\/strong>. Aus diesem Grund wurden die folgenden Pr\u00e4diktoren berechnet:<\/p>\n<\/div><ul style=\"--awb-line-height:27.2px;--awb-icon-width:27.2px;--awb-icon-height:27.2px;--awb-icon-margin:11.2px;--awb-content-margin:38.4px;\" class=\"fusion-checklist fusion-checklist-2 fusion-checklist-default type-icons\"><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">Relative Differenz zwischen dem aktuellen Preis eines Artikels und seinem historischen Durchschnittspreis, um die Wirkung von Werbeangeboten hervorzuheben.<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">Relative Preisdifferenz zum gleichen Artikel in anderen Gesch\u00e4ften, um zu verstehen, ob das Gesch\u00e4ft einen attraktiven Preis hat oder nicht.<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Relative Preisdifferenz zu anderen Artikeln, die im gleichen Gesch\u00e4ft und in der gleichen Produktkategorie verkauft werden, um gewisse Kannibalisierungseffekte zu erfassen.<\/p>\n<\/div><\/li><\/ul><div class=\"fusion-title title fusion-title-8 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Kodierung kategorischer Variablen<\/h2><\/div><div class=\"fusion-text fusion-text-12\"><p>Kategorische Variablen wie das Bundesland, das Gesch\u00e4ft, der Produktname oder die Kategorie haben ebenfalls eine hohe Vorhersagekraft. Diese Informationen m\u00fcssen in Features kodiert werden, damit das Modell die dataset-Hierarchie nutzen kann. Die One-Hot-Kodierung ist hier keine Option, da einige dieser kategorischen Variablen eine sehr hohe Kardinalit\u00e4t aufweisen (3049 unterschiedliche Produkte). Stattdessen haben wir eine\u00a0<strong>geordnete Zielkodierung<\/strong>, was bedeutet, dass jede Beobachtung durch den durchschnittlichen Umsatz vergangener Beobachtungen mit demselben kategorischen Wert kodiert wird. Das dataset ist bei dieser Aufgabe nach Zeit geordnet, um data-Lecks zu vermeiden.<\/p>\n<p>Alle kategorialen Variablen und einige ihrer Kombinationen wurden mit dieser Methode kodiert. Dies f\u00fchrt zu sehr informativen Merkmalen, von denen das beste die Kodierung der Kombination von Produkt und Gesch\u00e4ft ist. Wenn Sie mit anderen Kodierern experimentieren m\u00f6chten, finden Sie eine breite Palette von Methoden\u00a0<a href=\"http:\/\/contrib.scikit-learn.org\/category_encoders\/\" target=\"_blank\" rel=\"noopener\">Hier<\/a>.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-9 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Tweedie-Verlust bei intermittierenden Werten<\/h2><\/div><div class=\"fusion-text fusion-text-13\"><p>Es gibt verschiedene m\u00f6gliche Strategien, um mit dem Problem der intermittierenden Werte umzugehen. Einige Teilnehmer haben sich daf\u00fcr entschieden, 2 getrennte Modelle zu erstellen: eines, um vorherzusagen, ob das Produkt an einem bestimmten Tag verf\u00fcgbar sein wird oder nicht, und ein zweites, um die Verk\u00e4ufe zu prognostizieren. Wie viele andere haben auch wir uns f\u00fcr eine andere Option entschieden, n\u00e4mlich die Verwendung einer an das Problem angepassten Zielfunktion: die\u00a0<strong>Tweedie Verlust<\/strong>.<\/p>\n<p>Ohne auf die mathematischen Details einzugehen, lassen Sie uns versuchen zu verstehen, warum diese Verlustfunktion f\u00fcr unser Problem geeignet ist, indem wir die Umsatzverteilung im Training data und die Tweedie-Verteilung vergleichen:<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-4 hover-type-none\"><img decoding=\"async\" width=\"463\" height=\"169\" title=\"Bild-3-\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-3-.png\" data-orig-src=\"https:\/\/www.artefact.com\/wp-content\/uploads\/2021\/03\/image-3-.png\" alt class=\"lazyload img-responsive wp-image-54241\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27463%27%20height%3D%27169%27%20viewBox%3D%270%200%20463%20169%27%3E%3Crect%20width%3D%27463%27%20height%3D%27169%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-3--200x73.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-3--400x146.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-3-.png 463w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 463px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-14\"><p>Sie sehen recht \u00e4hnlich aus und haben beide Werte, die sich um 0 herum konzentrieren. Wenn Sie den Tweedie-Verlust als Zielfunktion festlegen, wird das Modell im Grunde dazu gezwungen\u00a0<strong class=\"ia ld\">maximieren Sie die Wahrscheinlichkeit dieser Verteilung<\/strong>\u00a0und damit die richtige Anzahl von 0s vorhersagen. Au\u00dferdem verf\u00fcgt diese Verlustfunktion \u00fcber einen Parameter - dessen Werte zwischen 1 und 2 liegen -, der an die Verteilung des vorliegenden Problems angepasst werden kann:<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-5 hover-type-none\"><img decoding=\"async\" width=\"696\" height=\"157\" title=\"image-4-\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-4-.png\" data-orig-src=\"https:\/\/www.artefact.com\/wp-content\/uploads\/2021\/03\/image-4-.png\" alt class=\"lazyload img-responsive wp-image-54246\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27696%27%20height%3D%27157%27%20viewBox%3D%270%200%20696%20157%27%3E%3Crect%20width%3D%27696%27%20height%3D%27157%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-4--200x45.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-4--400x90.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-4--600x135.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-4-.png 696w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 696px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-15\"><p>Ausgehend von unserer dataset-Verteilung k\u00f6nnen wir davon ausgehen, dass der optimale Wert zwischen 1 und 1,5 liegt, aber um genauer zu sein, werden wir diesen Parameter sp\u00e4ter mit einer Kreuzvalidierung abstimmen. Diese Zielfunktion ist auch f\u00fcr andere Gradient-Boosting-Modelle wie XGBoost oder CatBoost verf\u00fcgbar, so dass es sich auf jeden Fall lohnt, sie auszuprobieren, wenn Sie mit intermittierenden Werten zu tun haben.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-10 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Wie kann man 28 Tage im Voraus prognostizieren? Das Beste aus den Lag-Funktionen machen<\/h2><\/div><div class=\"fusion-text fusion-text-16\"><p>Wie oben erl\u00e4utert, sind die Verz\u00f6gerungsmerkmale um einen bestimmten Zeitraum verschobene Ums\u00e4tze. Ihre Werte h\u00e4ngen also davon ab, wo Sie im Prognosehorizont stehen. Die an einem bestimmten Tag D get\u00e4tigten Verk\u00e4ufe k\u00f6nnen als 1-Tages-Verz\u00f6gerung betrachtet werden, wenn Sie einen Tag im Voraus prognostizieren, oder als 28-Tages-Verz\u00f6gerung, wenn Sie 28 Tage im Voraus prognostizieren. Das folgende Diagramm veranschaulicht diesen Punkt:<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-6 hover-type-none\"><img decoding=\"async\" width=\"700\" height=\"214\" title=\"Bild-5\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-5.png\" data-orig-src=\"https:\/\/www.artefact.com\/wp-content\/uploads\/2021\/03\/image-5.png\" alt class=\"lazyload img-responsive wp-image-54251\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27700%27%20height%3D%27214%27%20viewBox%3D%270%200%20700%20214%27%3E%3Crect%20width%3D%27700%27%20height%3D%27214%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-5-200x61.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-5-400x122.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-5-600x183.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-5.png 700w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 700px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-17\"><p>Dieses Konzept ist wichtig, um zu verstehen, welche Funktionen\u00a0<strong>zum Zeitpunkt der Vorhersage verf\u00fcgbar<\/strong>. Hier befinden wir uns am Tag D und m\u00f6chten den Umsatz f\u00fcr die n\u00e4chsten 28 Tage prognostizieren. Wenn wir dasselbe Modell - und damit dieselben Merkmale - f\u00fcr Vorhersagen f\u00fcr den gesamten Prognosehorizont verwenden m\u00f6chten, k\u00f6nnen wir nur Lags verwenden, die f\u00fcr die Vorhersage aller Tage zwischen D+1 und D+28 zur Verf\u00fcgung stehen. Das bedeutet, wenn wir das Merkmal 1-Tages-Lag verwenden, um das Modell zu trainieren, muss diese Variable auch f\u00fcr Vorhersagen an D+2, D+3, ... und D+28 gef\u00fcllt werden, w\u00e4hrend sie sich auf Daten in der Zukunft bezieht.<\/p>\n<p>Dennoch sind Verz\u00f6gerungen wahrscheinlich die\u00a0<strong>Merkmale mit der gr\u00f6\u00dften Vorhersagekraft<\/strong>, Daher ist es wichtig, einen Weg zu finden, diese Informationen optimal zu nutzen. Wir haben 3 Optionen in Betracht gezogen, um dieses Problem zu umgehen. Lassen Sie uns sehen, wie sie abgeschnitten haben.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-11 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Option 1: Ein Modell f\u00fcr alle Wochen<\/h2><\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-7 hover-type-none\"><img decoding=\"async\" width=\"700\" height=\"397\" title=\"image-6\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-6.png\" data-orig-src=\"https:\/\/www.artefact.com\/wp-content\/uploads\/2021\/03\/image-6.png\" alt class=\"lazyload img-responsive wp-image-54256\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27700%27%20height%3D%27397%27%20viewBox%3D%270%200%20700%20397%27%3E%3Crect%20width%3D%27700%27%20height%3D%27397%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-6-200x113.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-6-400x227.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-6-600x340.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-6.png 700w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 700px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-18\"><p>Die erste Option ist die offensichtlichste. Sie besteht darin, dasselbe Modell zu verwenden, um Vorhersagen f\u00fcr alle Wochen des Prognosehorizonts zu treffen. Wie wir soeben erl\u00e4utert haben, ist dies mit einer gro\u00dfen Einschr\u00e4nkung verbunden: Es k\u00f6nnen nur die Merkmale verwendet werden, die f\u00fcr die Vorhersage von T+28 verf\u00fcgbar sind. Daher m\u00fcssen wir\u00a0<strong class=\"ia ld\">alle Informationen aus den 27 letzten Lags loswerden<\/strong>. Das ist schade, denn die j\u00fcngsten Lags sind auch die informativsten, so dass wir eine andere Option in Betracht gezogen haben.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-12 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Option 2: W\u00f6chentliche Modelle<\/h2><\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-8 hover-type-none\"><img decoding=\"async\" width=\"700\" height=\"396\" title=\"Bild-7-\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-7-.png\" data-orig-src=\"https:\/\/www.artefact.com\/wp-content\/uploads\/2021\/03\/image-7-.png\" alt class=\"lazyload img-responsive wp-image-54261\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27700%27%20height%3D%27396%27%20viewBox%3D%270%200%20700%20396%27%3E%3Crect%20width%3D%27700%27%20height%3D%27396%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-7--200x113.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-7--400x226.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-7--600x339.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-7-.png 700w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 700px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-19\"><p>Diese Alternative besteht darin, f\u00fcr jede Woche ein anderes LightGBM-Modell zu trainieren. Im obigen Diagramm lernt jedes Modell von den j\u00fcngsten m\u00f6glichen Lags in Bezug auf die Einschr\u00e4nkung, die durch seinen Vorhersagehorizont auferlegt wird. Nach der gleichen Logik wie bei der vorherigen Option bedeutet dies, dass jedes Modell alle Lags nutzen kann, mit Ausnahme derer, die neuer sind als der am weitesten entfernte Tag, den es vorherzusagen gilt.<\/p>\n<p>Genauer gesagt:<\/p>\n<\/div><ul style=\"--awb-line-height:27.2px;--awb-icon-width:27.2px;--awb-icon-height:27.2px;--awb-icon-margin:11.2px;--awb-content-margin:38.4px;\" class=\"fusion-checklist fusion-checklist-3 fusion-checklist-default type-icons\"><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">Modell 1 erstellt Vorhersagen f\u00fcr die Tage 1-7 und st\u00fctzt sich dabei auf alle Verz\u00f6gerungen au\u00dfer den 6 j\u00fcngsten.<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">Modell 2 erstellt Vorhersagen f\u00fcr die Tage 8-14 und st\u00fctzt sich dabei auf alle Verz\u00f6gerungen au\u00dfer den 13 j\u00fcngsten.<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">Modell 3 macht Vorhersagen f\u00fcr die Tage 15-21 und st\u00fctzt sich dabei auf alle Verz\u00f6gerungen au\u00dfer den 20 j\u00fcngsten.<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">Modell 4 erstellt Vorhersagen f\u00fcr die Tage 22-28 und st\u00fctzt sich dabei auf alle Verz\u00f6gerungen au\u00dfer den 27 j\u00fcngsten, genau wie bei Option 1.<\/div><\/li><\/ul><div class=\"fusion-text fusion-text-20\"><p>Mit dieser Methode k\u00f6nnen wir<strong>\u00a0die Verz\u00f6gerungsinformationen f\u00fcr die ersten 3 Wochen besser zu nutzen und damit die Prognosegenauigkeit unserer L\u00f6sung zu verbessern<\/strong>. Es hat sich gelohnt, weil es ein Kaggle-Wettbewerb war, aber\u00a0<strong>f\u00fcr ein industrialisiertes Projekt sollten auch Fragen der Komplexit\u00e4t, der Wartung und der Interpretierbarkeit in Betracht gezogen werden<\/strong>.<\/p>\n<p>Diese Option k\u00f6nnte in der Tat sehr rechenintensiv sein, und wenn wir eine landesweite Einf\u00fchrung anstreben, m\u00fcssten wir Hunderte von Modellen in Echtzeit pflegen. In diesem Fall w\u00e4re zu pr\u00fcfen, ob der Leistungszuwachs gro\u00df genug ist, um diese komplexere Implementierung zu rechtfertigen.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-13 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Option 3: Rekursive Modellierung<\/h2><\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-9 hover-type-none\"><img decoding=\"async\" width=\"700\" height=\"388\" title=\"image-8\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-8.png\" data-orig-src=\"https:\/\/www.artefact.com\/wp-content\/uploads\/2021\/03\/image-8.png\" alt class=\"lazyload img-responsive wp-image-54266\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27700%27%20height%3D%27388%27%20viewBox%3D%270%200%20700%20388%27%3E%3Crect%20width%3D%27700%27%20height%3D%27388%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-8-200x111.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-8-400x222.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-8-600x333.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/image-8.png 700w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 700px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-21\"><p>Die letzte Option verwendet ebenfalls Wochenmodelle, aber diesmal auf rekursive Weise.\u00a0<strong>Rekursive Modellierung<\/strong>\u00a0bedeutet, dass Vorhersagen, die f\u00fcr eine bestimmte Woche erstellt wurden, als Verz\u00f6gerungsmerkmale f\u00fcr die folgenden Wochen verwendet werden. Dies geschieht\u00a0<strong>sequentiell<\/strong>: Wir machen zun\u00e4chst Prognosen f\u00fcr die erste Woche, indem wir alle Verz\u00f6gerungen au\u00dfer den 6 j\u00fcngsten verwenden. Dann prognostizieren wir Woche 2, indem wir unsere vorherigen Prognosen als 1-w\u00f6chige Lags verwenden, anstatt weitere Lags wie in Option 2 auszuschlie\u00dfen. Indem wir den gleichen Prozess wiederholen, erhalten wir immer die j\u00fcngsten Lags, auch f\u00fcr die Wochen 3 und 4, was uns erlaubt, diese Informationen zum Trainieren der Modelle zu nutzen.<\/p>\n<p>Es lohnt sich, diese Methode zu testen, aber bedenken Sie, dass sie ziemlich\u00a0<strong>instabil, da sich die Fehler von Woche zu Woche ausbreiten<\/strong>. Wenn das Modell der ersten Woche gro\u00dfe Fehler macht, werden diese Fehler vom n\u00e4chsten Modell als Wahrheit angenommen, das dann unweigerlich schlecht abschneidet, und so weiter. Deshalb haben wir beschlossen\u00a0<strong>bleiben Sie bei Option 2<\/strong>, das scheint zuverl\u00e4ssiger zu sein.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-14 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Sicherstellung der Robustheit von Modellen mit einer geeigneten Kreuzvalidierung: Warum die Kreuzvalidierung f\u00fcr Zeitreihen entscheidend ist<\/h2><\/div><div class=\"fusion-text fusion-text-22\"><p>Bei jedem Projekt zum maschinellen Lernen ist die Anwendung einer geeigneten Kreuzvalidierungsstrategie von entscheidender Bedeutung, um die Genauigkeit au\u00dferhalb der Stichprobe korrekt zu simulieren, Hyperparameter sorgf\u00e4ltig auszuw\u00e4hlen und eine \u00dcberanpassung zu vermeiden. Bei der Vorhersage muss dies sorgf\u00e4ltig geschehen, denn es besteht eine zeitliche Abh\u00e4ngigkeit zwischen den Beobachtungen, die erhalten bleiben muss. Mit anderen Worten, <strong>wir wollen verhindern, dass das Modell in die Zukunft schaut, wenn wir es trainieren<\/strong>.<\/p>\n<p>Der Validierungszeitraum, in dem das Modell getestet wird, ist ebenfalls von gro\u00dfer Bedeutung, wenn es um Zeitreihen geht. Die Leistung des Modells und der optimale Satz von Hyperparametern k\u00f6nnen je nach dem Zeitraum, in dem das Modell trainiert und getestet wird, stark variieren. <strong>Unser Ziel ist es daher, die Parameter zu finden, die am ehesten die Leistung maximieren, und zwar nicht \u00fcber einen zuf\u00e4lligen Zeitraum, sondern \u00fcber den Zeitraum, den wir prognostizieren wollen<\/strong>, d.h. die n\u00e4chsten 4 Wochen.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-15 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Anpassen des Validierungsprozesses an das jeweilige Problem<\/h2><\/div><div class=\"fusion-text fusion-text-23\"><p>Um dieses Ziel zu erreichen, haben wir 5 Validierungssets ausgew\u00e4hlt, die\u00a0<strong>die f\u00fcr den Vorhersagezeitraum relevant sind<\/strong>. Das Diagramm unten zeigt, wie sie \u00fcber die Zeit verteilt sind. F\u00fcr jede Kreuzvalidierung wird das Modell mit verschiedenen Parameterkombinationen auf dem Trainingssatz trainiert und auf dem Validierungssatz anhand des mittleren quadratischen Fehlers bewertet.<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-10 hover-type-none\"><img decoding=\"async\" width=\"700\" height=\"314\" title=\"Bild-9-\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/Image-9-.png\" data-orig-src=\"https:\/\/www.artefact.com\/wp-content\/uploads\/2021\/03\/Image-9-.png\" alt class=\"lazyload img-responsive wp-image-54271\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27700%27%20height%3D%27314%27%20viewBox%3D%270%200%20700%20314%27%3E%3Crect%20width%3D%27700%27%20height%3D%27314%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/Image-9--200x90.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/Image-9--400x179.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/Image-9--600x269.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/Image-9-.png 700w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 700px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-24\"><p>Die Folds 1, 2 und 3 zielen darauf ab, die Parameter zu identifizieren, die die Performance in den letzten Perioden, d.h. in den letzten 3 Monaten, maximiert haben. Das Problem ist, dass diese 3 Monate m\u00f6glicherweise andere Besonderheiten aufweisen als der kommende Zeitraum, den wir prognostizieren m\u00f6chten. Nehmen wir zum Beispiel an, dass die Gesch\u00e4fte in den letzten Monaten eine riesige Werbesaison gestartet haben, die erst heute zu Ende geht.<\/p>\n<p>Diese Aktionen w\u00fcrden sich wahrscheinlich auf das Verhalten des Modells auswirken, aber es w\u00e4re riskant, sich nur auf diese j\u00fcngsten Zeitr\u00e4ume zu verlassen, um das Modell abzustimmen, da dies nicht repr\u00e4sentativ f\u00fcr die n\u00e4chsten Ereignisse ist.<\/p>\n<p>Um dieses Risiko abzuschw\u00e4chen, haben wir auch die Falten 4 und 5 einbezogen, die dem um 1 bzw. 2 Jahre verschobenen Prognosezeitraum entsprechen. Diese Zeitr\u00e4ume sind wahrscheinlich \u00e4hnlich, da das Problem eine starke j\u00e4hrliche Saisonalit\u00e4t aufweist, was im Einzelhandel h\u00e4ufig der Fall ist. H\u00e4tten wir eine andere Periodizit\u00e4t, k\u00f6nnten wir eine beliebige Kreuzvalidierungsstrategie w\u00e4hlen, die wirtschaftlich sinnvoller ist. Am Ende haben wir die Hyperparameterkombination mit dem geringsten Fehler \u00fcber die 5 Foldings ausgew\u00e4hlt, um das endg\u00fcltige Modell zu trainieren.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-16 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Ergebnisse<\/h2><\/div><div class=\"fusion-text fusion-text-25\"><p>Die verschiedenen oben genannten Techniken erm\u00f6glichten es uns, eine\u00a0<strong>0.59 gewichteter RMSSE<\/strong>\u00a0- die bei Kaggle verwendete Metrik - was einer gewichteten Vorhersagegenauigkeit von 82,8% entspricht. Das folgende Diagramm fasst die inkrementelle Leistung zusammen, die durch jeden Schritt erzeugt wird:<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-11 hover-type-none\"><img decoding=\"async\" width=\"454\" height=\"262\" title=\"Bild-10\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/Image-10.png\" data-orig-src=\"https:\/\/www.artefact.com\/wp-content\/uploads\/2021\/03\/Image-10.png\" alt class=\"lazyload img-responsive wp-image-54276\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27454%27%20height%3D%27262%27%20viewBox%3D%270%200%20454%20262%27%3E%3Crect%20width%3D%27454%27%20height%3D%27262%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/Image-10-200x115.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/Image-10-400x231.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/Image-10.png 454w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 454px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-26\"><p>Diese Zahlen sind Richtwerte: Die inkrementelle Genauigkeit h\u00e4ngt auch von der Reihenfolge ab, in der die einzelnen Schritte ausgef\u00fchrt werden.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-17 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Wichtigste Erkenntnisse<\/h2><\/div><div class=\"fusion-text fusion-text-27\"><p>Wir haben dank der Erkenntnisse der Teilnehmer eine Menge aus dieser Herausforderung gelernt und hoffen, dass sie auch Sie zum Nachdenken angeregt hat. Hier sind unsere wichtigsten Erkenntnisse:<\/p>\n<\/div><ul style=\"--awb-line-height:27.2px;--awb-icon-width:27.2px;--awb-icon-height:27.2px;--awb-icon-margin:11.2px;--awb-content-margin:38.4px;\" class=\"fusion-checklist fusion-checklist-4 fusion-checklist-default type-icons\"><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">Arbeiten Sie an einer kleinen, aber repr\u00e4sentativen Teilmenge von data, um schnell zu iterieren.<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">Achten Sie beim Feature-Engineering sehr genau auf data-Leaks: Stellen Sie sicher, dass alle von Ihnen berechneten Features zum Zeitpunkt der Vorhersage verf\u00fcgbar sind.<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">W\u00e4hlen Sie eine Modellarchitektur, die es Ihnen erm\u00f6glicht, Verz\u00f6gerungen so weit wie m\u00f6glich auszunutzen, aber bedenken Sie auch die Komplexit\u00e4t, wenn Sie in die Produktion gehen wollen.<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">Entwickeln Sie eine Strategie zur Kreuzvalidierung, die an Ihr Gesch\u00e4ftsproblem angepasst ist, um die Leistung Ihrer Experimente korrekt zu bewerten.<\/div><\/li><\/ul><div class=\"fusion-text fusion-text-28\"><p>Vielen Dank f\u00fcr die Lekt\u00fcre und z\u00f6gern Sie nicht, sich zu melden, wenn Sie einen Kommentar zu diesem Thema haben!<\/p>\n<\/div><\/div><\/div><\/div><\/article><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-3 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-2 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-text fusion-text-29\"><p>Dieser Artikel wurde zuerst auf Artefact Tech Blog auf Medium ver\u00f6ffentlicht.<\/p>\n<\/div><div ><a class=\"fusion-button button-flat fusion-button-default-size button-default fusion-button-default button-1 fusion-button-default-span fusion-button-default-type button-primary-medium\" target=\"_self\" href=\"https:\/\/medium.com\/artefact-engineering-and-data-science\" rel=\"noopener\"><span class=\"fusion-button-text awb-button__text awb-button__text--default\">Artikel ansehen<\/span><\/a><\/div><\/div><\/div><\/div><\/div><\/p>","protected":false},"excerpt":{"rendered":"<p>5. Februar 2021<br \/>\nIn diesem Artikel fasst Data-Wissenschaftler Maxime Lutel seine Erkenntnisse aus dem M5-Wettbewerb f\u00fcr Umsatzprognosen zusammen, bei dem es darum ging, die zuk\u00fcnftigen Ums\u00e4tze in mehreren Walmart-Filialen vorherzusagen. Er f\u00fchrt Sie durch unsere L\u00f6sung und erl\u00e4utert, welches maschinelle Lernmodell f\u00fcr diese Aufgabe am besten geeignet war.<\/p>","protected":false},"featured_media":49866,"parent":0,"template":"","meta":{"_acf_changed":false,"ep_exclude_from_search":false},"blog-category":[2995],"blog-language":[2991],"class_list":["post-49861","blog","type-blog","status-publish","has-post-thumbnail","hentry","blog-category-ai-technology","blog-language-en"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/blog\/49861","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/blog"}],"about":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/types\/blog"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/media\/49866"}],"wp:attachment":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/media?parent=49861"}],"wp:term":[{"taxonomy":"blog-category","embeddable":true,"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/blog-category?post=49861"},{"taxonomy":"blog-language","embeddable":true,"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/blog-language?post=49861"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}