{"id":71574,"date":"2023-07-05T14:29:02","date_gmt":"2023-07-05T13:29:02","guid":{"rendered":"https:\/\/www.artefact.com\/?post_type=blog&#038;p=71574"},"modified":"2024-09-20T17:45:57","modified_gmt":"2024-09-20T16:45:57","slug":"encoding-categorical-features-in-forecasting-are-we-all-doing-it-wrong","status":"publish","type":"blog","link":"https:\/\/www.artefact.com\/de\/blog\/encoding-categorical-features-in-forecasting-are-we-all-doing-it-wrong\/","title":{"rendered":"Kodierung kategorischer Merkmale bei der Vorhersage: Machen wir es alle falsch?"},"content":{"rendered":"<p><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling article-author\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-background-color:#ffffff;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_2 1_2 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:50%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:50%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-1 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Autor<\/h2><\/div><img decoding=\"async\" src=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27150%27%20height%3D%270%27%20viewBox%3D%270%200%20150%200%27%3E%3Crect%20width%3D%27150%27%20height%3D%270%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Youssef-Oudghiri.jpeg\" alt=\"Image\" class=\"lazyload artefact-elegant-image align-left article-author-image\" style=\"width: 150px; border-radius: 54% 46% 77% 23% \/ 74% 40% 60% 26%; overflow: hidden;\" width=\"150\" height=\"auto\" \/><div class=\"fusion-title title fusion-title-2 fusion-sep-none fusion-title-text fusion-title-size-three article-author-name-title\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Youssef Oudghiri<\/h3><\/div><div class=\"fusion-text fusion-text-1 article-author-description\" style=\"--awb-text-transform:none;\"><p>Data Wissenschaftlerin bei Artefact Frankreich<\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-2 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-1 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-text fusion-text-2 description\"><p>Wir schlagen eine neuartige Methode zur Kodierung von kategorialen Merkmalen vor, die speziell f\u00fcr Prognoseanwendungen geeignet ist. Im Wesentlichen kodiert dieser Ansatz kategoriale Merkmale durch die Modellierung des Trends der mit jeder Kategorie verbundenen Gr\u00f6\u00dfen. In unseren Experimenten zeigt dieser Ansatz erhebliche Leistungsvorteile - sowohl in Bezug auf die Vorhersagegenauigkeit als auch auf die Verzerrung - da er es baumbasierten Ensemblemodellen erm\u00f6glicht, Trends besser zu modellieren und zu extrapolieren.<\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-3 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-margin-top:40px;--awb-margin-bottom:40px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-center fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-2 fusion_builder_column_1_1 1_1 fusion-flex-column fusion-flex-align-self-center fusion-column-inner-bg-wrapper\" style=\"--awb-padding-top:20px;--awb-padding-right:20px;--awb-padding-bottom:20px;--awb-padding-left:20px;--awb-overflow:hidden;--awb-inner-bg-size:cover;--awb-border-color:rgba(10,17,40,0.1);--awb-border-top:1px;--awb-border-right:1px;--awb-border-bottom:1px;--awb-border-left:1px;--awb-border-style:solid;--awb-border-radius:4px 4px 4px 4px;--awb-inner-bg-border-radius:4px 4px 4px 4px;--awb-inner-bg-overflow:hidden;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\" data-scroll-devices=\"small-visibility,medium-visibility,large-visibility\"><span class=\"fusion-column-inner-bg hover-type-none\"><a class=\"fusion-column-anchor\" href=\"https:\/\/medium.com\/artefact-engineering-and-data-science\/encoding-categorical-features-in-forecasting-are-we-all-doing-it-wrong-fe8a9a6488da\" rel=\"noopener noreferrer\" target=\"_blank\"><span class=\"fusion-column-inner-bg-image\"><\/span><\/a><\/span><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-center fusion-content-layout-row fusion-flex-align-items-center\"><div class=\"fusion-text fusion-text-3\"><p><u>Lesen Sie unseren Artikel \u00fcber<\/u><\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-margin-right:20px;--awb-margin-left:20px;--awb-max-width:150px;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-1 hover-type-none\"><img decoding=\"async\" width=\"4000\" height=\"992\" title=\"Mittel Blog\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog.png\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog.png\" alt class=\"lazyload img-responsive wp-image-60582\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%274000%27%20height%3D%27992%27%20viewBox%3D%270%200%204000%20992%27%3E%3Crect%20width%3D%274000%27%20height%3D%27992%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-200x50.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-400x99.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-600x149.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-800x198.png 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-1200x298.png 1200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog.png 4000w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 4000px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-4\"><p>.<\/p>\n<\/div><\/div><\/div><\/div><\/div><article class=\"fusion-fullwidth fullwidth-box fusion-builder-row-4 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-3 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-3 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Einf\u00fchrung<\/h2><\/div><div class=\"fusion-text fusion-text-5\"><p>Die Motivation f\u00fcr diese Arbeit ergab sich aus zahlreichen Kundenprognoseprojekten bei Artefact, bei denen unsere Boosting-Modelle zum Zeitpunkt der Vorhersage eine hohe Verzerrung aufwiesen. In einer Diagnosephase haben wir festgestellt, dass eine der Hauptursachen f\u00fcr die Verzerrung von Ensemble-Learning-Modellen darin liegt, dass es schwierig ist, Trends und schwankende Werte genau zu modellieren.<\/p>\n<p>Im Folgenden werden wir demonstrieren\u00a0<strong>warum<\/strong>\u00a0und\u00a0<strong>wie<\/strong>\u00a0haben wir einen neuen Ansatz f\u00fcr die Kodierung kategorischer Merkmale verwendet. Anhand unserer Experimente mit einem Kundenprojekt f\u00fcr Einzelhandelsprognosen und verschiedenen \u00f6ffentlichen data-Sets konnten wir nachweisen, dass diese Technik Verzerrungen wirksam abmildern und die Genauigkeit verbessern kann.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-4 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Boosting und Trends, warum ist das so kompliziert?<\/h2><\/div><div class=\"fusion-title title fusion-title-5 fusion-sep-none fusion-title-text fusion-title-size-three\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Boosting-Algorithmen haben es schwer, zu extrapolieren<\/h3><\/div><div class=\"fusion-text fusion-text-6\"><p>Boosting-Algorithmen haben es schwer, Trends zu modellieren und zu extrapolieren, da sie keine neuen Werte vorhersagen k\u00f6nnen, die im Trainingsset nicht vorkommen bzw. in den Bl\u00e4ttern nicht vorhanden sind. \u201c<a href=\"https:\/\/pypi.org\/project\/linear-tree\/\" target=\"_blank\" rel=\"noopener ugc nofollow\">Linearer Baum<\/a>\u201dModelle versuchen, dieses Problem zu lindern, aber unsere Tests ergaben keine eindeutigen Ergebnisse mit dieser Methode.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-6 fusion-sep-none fusion-title-text fusion-title-size-three\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Klassische Kodierungen dr\u00e4ngen zu statischen Vorhersagen<\/h3><\/div><div class=\"fusion-text fusion-text-7\"><p>Die g\u00e4ngigsten Kodierungsmethoden, die beim Boosten verwendet werden, f\u00f6rdern statische Beziehungen zwischen unabh\u00e4ngigen und abh\u00e4ngigen Variablen, was wiederum zu einer erh\u00f6hten Verzerrung bei Vorhandensein von Trends beitr\u00e4gt. Das folgende Diagramm veranschaulicht dieses Ph\u00e4nomen:<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-2 hover-type-none\"><img decoding=\"async\" width=\"1400\" height=\"477\" alt=\"Classical encodings push towards static predictions\" title=\"Klassische Kodierungen dr\u00e4ngen zu statischen Vorhersagen\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Classical-encodings-push-towards-static-predictions.webp\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Classical-encodings-push-towards-static-predictions.webp\" class=\"lazyload img-responsive wp-image-71578\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%271400%27%20height%3D%27477%27%20viewBox%3D%270%200%201400%20477%27%3E%3Crect%20width%3D%271400%27%20height%3D%27477%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Classical-encodings-push-towards-static-predictions-200x68.webp 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Classical-encodings-push-towards-static-predictions-400x136.webp 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Classical-encodings-push-towards-static-predictions-600x204.webp 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Classical-encodings-push-towards-static-predictions-800x273.webp 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Classical-encodings-push-towards-static-predictions-1200x409.webp 1200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Classical-encodings-push-towards-static-predictions.webp 1400w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 1400px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-8\"><p style=\"text-align: center;\"><em>Vereinfachte visuelle Darstellung, die die statische Natur der kategorialen Merkmalskodierung in Boosting-Algorithmen verdeutlicht<\/em><\/p>\n<\/div><div class=\"fusion-text fusion-text-9\"><p>Wir r\u00e4umen ein, dass die obige Darstellung eine zu starke Vereinfachung ist, denn Entscheidungsb\u00e4ume sind komplexer und in der Lage, nichtlineare Beziehungen auf der Grundlage mehrerer Faktoren zu erkennen. In der Tat k\u00f6nnte die Bedingung \u201cFarbe ist schwarz\u201d mit \u201cder Monat ist Juni\u201d verbunden sein. In diesem Fall h\u00e4tte die Farbe Schwarz nicht zu jeder Zeit die gleiche Auswirkung. Aber lassen Sie uns einen Blick auf das gro\u00dfe Ganze werfen:<\/p>\n<\/div><ul style=\"--awb-line-height:27.2px;--awb-icon-width:27.2px;--awb-icon-height:27.2px;--awb-icon-margin:11.2px;--awb-content-margin:38.4px;\" class=\"fusion-checklist fusion-checklist-1 fusion-checklist-default type-icons paddingList dark-text\"><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Die Zuweisung einer einzigen Auswirkung f\u00fcr die Farbe Schwarz im Juni ist immer noch nicht ideal, da die Auswirkung im Juni 2021 von der Auswirkung im Juni 2022 abweichen kann. Selbst wenn wir das Jahr mit einbeziehen, w\u00fcrde erstens die Entscheidungsgrenze zu komplex werden, um sie zu erstellen und zu identifizieren, aber auch, was w\u00fcrde passieren, wenn die Ausbildung data im Jahr 2022 endet und Vorhersagen f\u00fcr 2023 gemacht werden m\u00fcssen?<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>Feature-Engineering soll das Modell dabei unterst\u00fctzen, Beziehungen leichter zu erkennen<\/strong>. Wenn wir dem Modell dabei helfen k\u00f6nnen, die Auswirkung der Farbe Schwarz zu einem beliebigen Zeitpunkt zu assoziieren, ohne dass die Identifizierung komplexer Beziehungen erforderlich ist, w\u00e4re dies f\u00fcr das Modell von gro\u00dfem Vorteil. Daher ...<\/p>\n<\/div><\/li><\/ul><div class=\"fusion-title title fusion-title-7 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Unser neuer Ansatz: Dynamische Kodierung von kategorischen Merkmalen<\/h2><\/div><div class=\"fusion-title title fusion-title-8 fusion-sep-none fusion-title-text fusion-title-size-three\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Basis der dynamischen Kodierung (v1 ohne Elementebene)<\/h3><\/div><div class=\"fusion-text fusion-text-10\"><p id=\"9918\" data-selectable-paragraph=\"\">In einem Satz k\u00f6nnte man unsere Methode zur Kodierung kategorischer Merkmale folgenderma\u00dfen beschreiben:\u00a0<strong>modellieren wir die Trendkomponente jeder Kategorie und verwenden diese Trendwerte, um das kategoriale Merkmal zu kodieren<\/strong>.<\/p>\n<p id=\"b6c1\" data-selectable-paragraph=\"\">Das folgende Diagramm veranschaulicht den Unterschied zwischen einer statischen Mittelwertkodierung und einer trendbasierten Kodierung f\u00fcr zwei Farbkategorien: Schwarz und Gold.<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-3 hover-type-none\"><img decoding=\"async\" width=\"1400\" height=\"453\" title=\"Basis der dynamischen Kodierung (v1 ohne Elementebene)\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Basis-of-dynamic-encoding-v1-without-item-level.webp\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Basis-of-dynamic-encoding-v1-without-item-level.webp\" alt class=\"lazyload img-responsive wp-image-71579\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%271400%27%20height%3D%27453%27%20viewBox%3D%270%200%201400%20453%27%3E%3Crect%20width%3D%271400%27%20height%3D%27453%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Basis-of-dynamic-encoding-v1-without-item-level-200x65.webp 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Basis-of-dynamic-encoding-v1-without-item-level-400x129.webp 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Basis-of-dynamic-encoding-v1-without-item-level-600x194.webp 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Basis-of-dynamic-encoding-v1-without-item-level-800x259.webp 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Basis-of-dynamic-encoding-v1-without-item-level-1200x388.webp 1200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Basis-of-dynamic-encoding-v1-without-item-level.webp 1400w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 1400px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-11\"><p style=\"text-align: center;\"><em>Illustration des dynamischen Kodierungsprinzips, das eine Trendmodellierung f\u00fcr jede Kategorie beinhaltet<\/em><\/p>\n<\/div><div class=\"fusion-text fusion-text-12\"><p id=\"8d62\" data-selectable-paragraph=\"\">In unseren Experimenten haben wir uns daf\u00fcr entschieden, Prophet f\u00fcr die Extraktion der Trendkomponente zu verwenden. Nat\u00fcrlich k\u00f6nnen Sie auch andere Zeitreihenprognosemodelle in Betracht ziehen.<\/p>\n<p id=\"5677\" data-selectable-paragraph=\"\">Beachten Sie, dass die statische Mittelwertkodierung impliziert, dass die Verk\u00e4ufe schwarzer Artikel zu jedem Zeitpunkt durchschnittlich 100 St\u00fcck\/Monat betragen. Die dynamische Kodierung hingegen erlaubt es, den steigenden Trend bei den schwarzen Gegenst\u00e4nden zu ber\u00fccksichtigen und ihn in die Zukunft zu extrapolieren. Eine \u00e4hnliche Aussage kann f\u00fcr Goldgegenst\u00e4nde gemacht werden. Unser Ansatz ist also besonders n\u00fctzlich bei data-Sets, bei denen die zu prognostizierende Zielvariable steile Trends \u00fcber die verschiedenen verf\u00fcgbaren Kategorien hinweg aufweist.<\/p>\n<p id=\"096b\" data-selectable-paragraph=\"\">Unser Hauptaugenmerk liegt darauf, das Modell in die Lage zu versetzen, sich leichter an die sich \u00e4ndernden Beziehungen zwischen unabh\u00e4ngigen Variablen und der zu prognostizierenden abh\u00e4ngigen Variable anzupassen. Daher k\u00f6nnte diese dynamische Kodierungsmethode auch auf numerische Merkmale angewendet werden. Nehmen wir das Beispiel des Preises. Obwohl der Preis numerisch ist und das Modell direkt darauf basierende Regeln aufstellen kann, k\u00f6nnen sich die Vorlieben der Menschen f\u00fcr preiswerte oder teure Artikel im Laufe der Zeit dennoch entwickeln und einem bestimmten Verkaufstrend folgen. Im Zusammenhang mit einer Wirtschaftskrise k\u00f6nnten zum Beispiel g\u00fcnstige Produkte einem steigenden Verkaufstrend folgen, w\u00e4hrend teure Produkte einem fallenden Trend folgen k\u00f6nnten. Wenn wir \u2018erschwinglich\u2019 als eine Kategorie und \u2018teuer\u2019 als eine andere betrachten, k\u00f6nnten wir eine dynamische Kodierung f\u00fcr das Merkmal Preis vorschlagen, so wie wir es f\u00fcr Farben getan haben.<\/p>\n<p id=\"671a\" data-selectable-paragraph=\"\">Es ist wichtig zu beachten, dass bei numerischen Merkmalen sowohl die Basisvariablen als auch die dynamisch kodierten Variablen im Modell verwendet werden k\u00f6nnen, da sie unterschiedliche Arten von Informationen liefern werden.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-9 fusion-sep-none fusion-title-text fusion-title-size-three\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Dynamischen Merkmalen wird mehr Bedeutung beigemessen (v2 mit Elementebene)<\/h3><\/div><div class=\"fusion-text fusion-text-13\"><p id=\"c481\" data-selectable-paragraph=\"\">Auch wenn diese neue Kodierungsmethode eine Verbesserung darstellt, ist die Bedeutung der kategorischen Merkmale oft nicht hoch genug, um die Vorhersagen bei der Untersuchung der Merkmalsbedeutung signifikant zu beeinflussen. Um den dynamischen Merkmalen mehr Bedeutung zu verleihen und damit eine bessere Modellierung und Extrapolation von Trends zu f\u00f6rdern, passen wir die Kodierungswerte f\u00fcr jede Zeitreihe \/ jedes Element einzeln an.<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-4 hover-type-none\"><img decoding=\"async\" width=\"1342\" height=\"296\" title=\"Dynamischen Merkmalen wird mehr Bedeutung beigemessen (v2 mit Elementebene)\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Giving-more-importance-to-dynamic-features-v2-with-item-level.webp\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Giving-more-importance-to-dynamic-features-v2-with-item-level.webp\" alt class=\"lazyload img-responsive wp-image-71580\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%271342%27%20height%3D%27296%27%20viewBox%3D%270%200%201342%20296%27%3E%3Crect%20width%3D%271342%27%20height%3D%27296%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Giving-more-importance-to-dynamic-features-v2-with-item-level-200x44.webp 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Giving-more-importance-to-dynamic-features-v2-with-item-level-400x88.webp 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Giving-more-importance-to-dynamic-features-v2-with-item-level-600x132.webp 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Giving-more-importance-to-dynamic-features-v2-with-item-level-800x176.webp 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Giving-more-importance-to-dynamic-features-v2-with-item-level-1200x265.webp 1200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Giving-more-importance-to-dynamic-features-v2-with-item-level.webp 1342w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 1342px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-14\"><p style=\"text-align: center;\"><em>Formel f\u00fcr die beiden Komponenten der dynamischen Kodierung: Kategorieebene und Elementebene<\/em><\/p>\n<\/div><div class=\"fusion-text fusion-text-15\"><p>Um auf unser Farbbeispiel zur\u00fcckzukommen: Bei zwei verschiedenen schwarzen Artikeln kann die dynamische Kodierung der Kategorie \u201cSchwarz\u201d f\u00fcr jeden Artikel auf der Grundlage seiner individuellen fr\u00fcheren Verk\u00e4ufe unterschiedlich sein.<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-5 hover-type-none\"><img decoding=\"async\" width=\"1400\" height=\"587\" alt=\"Table illustrating the calculation of dynamic encoding through a simple example\" title=\"Tabelle zur Veranschaulichung der Berechnung der dynamischen Kodierung anhand eines einfachen Beispiels\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Table-illustrating-the-calculation-of-dynamic-encoding-through-a-simple-example.webp\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Table-illustrating-the-calculation-of-dynamic-encoding-through-a-simple-example.webp\" class=\"lazyload img-responsive wp-image-71582\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%271400%27%20height%3D%27587%27%20viewBox%3D%270%200%201400%20587%27%3E%3Crect%20width%3D%271400%27%20height%3D%27587%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Table-illustrating-the-calculation-of-dynamic-encoding-through-a-simple-example-200x84.webp 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Table-illustrating-the-calculation-of-dynamic-encoding-through-a-simple-example-400x168.webp 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Table-illustrating-the-calculation-of-dynamic-encoding-through-a-simple-example-600x252.webp 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Table-illustrating-the-calculation-of-dynamic-encoding-through-a-simple-example-800x335.webp 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Table-illustrating-the-calculation-of-dynamic-encoding-through-a-simple-example-1200x503.webp 1200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Table-illustrating-the-calculation-of-dynamic-encoding-through-a-simple-example.webp 1400w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 1400px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-16\"><p style=\"text-align: center;\"><em>Tabelle zur Veranschaulichung der Berechnung der dynamischen Kodierung anhand eines einfachen Beispiels<\/em><\/p>\n<\/div><div class=\"fusion-title title fusion-title-10 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Experimente und Ergebnisse<\/h2><\/div><div class=\"fusion-title title fusion-title-11 fusion-sep-none fusion-title-text fusion-title-size-three\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Kunde dataset<\/h3><\/div><div class=\"fusion-text fusion-text-17\"><p>Wir haben unseren Ansatz zur Umsatzprognose f\u00fcr einen unserer Kunden aus der Einzelhandelsbranche verwendet. Wir haben unsere Methode in einem breiten Spektrum von Bereichen gr\u00fcndlich validiert, um ihre Effektivit\u00e4t sicherzustellen. Hier sind einige data-Punkte zum experimentellen Kontext:<\/p>\n<\/div><ul style=\"--awb-line-height:27.2px;--awb-icon-width:27.2px;--awb-icon-height:27.2px;--awb-icon-margin:11.2px;--awb-content-margin:38.4px;\" class=\"fusion-checklist fusion-checklist-2 fusion-checklist-default type-icons paddingList dark-text\"><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">Die Experimente wurden f\u00fcr 9 verschiedene Produktbereiche durchgef\u00fchrt, mit einem Boosting-Modell (LightGBM) f\u00fcr jeden Bereich.<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>F\u00fcr jeden Bereich wurde eine k-fache Kreuzvalidierung mit einem expandierenden Fenster durchgef\u00fchrt (k=5).<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Vorhersagehorizont: Tag+1 bis Tag+180.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Die Leistung wurde anhand von zwei Metriken bewertet:<\/p>\n<\/div><\/li><\/ul><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-6 hover-type-none\"><img decoding=\"async\" width=\"1400\" height=\"329\" title=\"formule\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/formule.webp\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/formule.webp\" alt class=\"lazyload img-responsive wp-image-71583\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%271400%27%20height%3D%27329%27%20viewBox%3D%270%200%201400%20329%27%3E%3Crect%20width%3D%271400%27%20height%3D%27329%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/formule-200x47.webp 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/formule-400x94.webp 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/formule-600x141.webp 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/formule-800x188.webp 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/formule-1200x282.webp 1200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/formule.webp 1400w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 1400px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-18\"><p id=\"3f94\" data-selectable-paragraph=\"\">Insgesamt erwies sich die Methode als sehr effizient,\u00a0<strong>was zu einer durchschnittlichen absoluten Verringerung der Verzerrung von 9,82% und einer durchschnittlichen absoluten Erh\u00f6hung der Vorhersagegenauigkeit von 6,29% f\u00fchrt.<\/strong>\u00a0\u00fcber die 9 Produktbereiche und 5 Kreuzvalidierungsfalten.<\/p>\n<p id=\"22b9\" data-selectable-paragraph=\"\">Im n\u00e4chsten Abschnitt \u00fcberpr\u00fcfen wir die Relevanz unserer Methode, indem wir sie an einem \u00f6ffentlichen dataset testen.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-12 fusion-sep-none fusion-title-text fusion-title-size-three\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Verkauf in \u00f6ffentlichen Gesch\u00e4ften dataset<\/h3><\/div><div class=\"fusion-text fusion-text-19\"><p id=\"fbf3\" data-selectable-paragraph=\"\">In dieser vereinfachten Fallstudie verwenden wir die\u00a0<a href=\"https:\/\/www.kaggle.com\/competitions\/store-sales-time-series-forecasting\/data\" target=\"_blank\" rel=\"noopener ugc nofollow\">Ladenverkauf - Zeitreihenprognose<\/a>\u00a0Kaggle dataset. Dieses dataset weist einen steilen Trend auf, wenn man die durchschnittliche Umsatzzeitreihe betrachtet, was unsere Methode besonders relevant macht. Au\u00dferdem betr\u00e4gt der gew\u00e4hlte Prognosehorizont drei Monate, was weit genug entfernt ist, um von den zus\u00e4tzlichen Extrapolationsf\u00e4higkeiten der dynamischen Kodierung zu profitieren. Zu Demonstrationszwecken beschr\u00e4nken wir das dataset auf den 31. M\u00e4rz 2016, kurz bevor ein Erdbeben auftrat und die Umsatzkurve abflachte.<\/p>\n<p id=\"2ec5\" data-selectable-paragraph=\"\">Vor der Kodierung umfasst unser anf\u00e4ngliches data-Set etwa 75% numerische Merkmale, darunter Lags, rollierende Mittelwerte, Kalendermerkmale und Feiertagsereignisse. Die restlichen 25% bestehen aus kategorischen Attributen wie Produktfamilie, Gesch\u00e4ftsnummer, Stadt und anderen.<\/p>\n<p id=\"f0f6\" data-selectable-paragraph=\"\">Es werden zwei verschiedene Modelle trainiert: Eines verwendet die kategorischen Merkmale, die mit unserer benutzerdefinierten Methode dynamisch kodiert wurden, w\u00e4hrend das andere die native Handhabung kategorischer Merkmale durch LightGBM nutzt.<\/p>\n<p id=\"f3b9\" data-selectable-paragraph=\"\">Beim Vergleich ihrer Leistung stellen wir eine deutliche Verbesserung des dynamischen Kodierungsansatzes fest. Die folgende Tabelle enth\u00e4lt eine Zusammenfassung der Ergebnisse:<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-7 hover-type-none\"><img decoding=\"async\" width=\"1222\" height=\"272\" alt=\"Comparison of RMSE, FA, and %Bias between LightGBM encoding method and dynamic encoding\" title=\"Bild 1\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image-1.webp\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image-1.webp\" class=\"lazyload img-responsive wp-image-71584\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%271222%27%20height%3D%27272%27%20viewBox%3D%270%200%201222%20272%27%3E%3Crect%20width%3D%271222%27%20height%3D%27272%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image-1-200x45.webp 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image-1-400x89.webp 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image-1-600x134.webp 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image-1-800x178.webp 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image-1-1200x267.webp 1200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image-1.webp 1222w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 1222px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-20\"><p style=\"text-align: center;\"><em>Vergleich von RMSE, FA und %Bias zwischen LightGBM-Kodierungsmethode und dynamischer Kodierung<\/em><\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-8 hover-type-none\"><img decoding=\"async\" width=\"1304\" height=\"364\" title=\"image2\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image2.webp\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image2.webp\" alt class=\"lazyload img-responsive wp-image-71585\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%271304%27%20height%3D%27364%27%20viewBox%3D%270%200%201304%20364%27%3E%3Crect%20width%3D%271304%27%20height%3D%27364%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image2-200x56.webp 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image2-400x112.webp 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image2-600x167.webp 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image2-800x223.webp 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image2-1200x335.webp 1200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image2.webp 1304w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 1304px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-21\"><p style=\"text-align: center;\"><em>Durchschnittlicher w\u00f6chentlicher Umsatz + 3-Monats-Prognosen (dynamische Kodierung vs. LightGBM-Kodierungsmethode)<br \/>\n<\/em><\/p>\n<\/div><div class=\"fusion-text fusion-text-22\"><p>Wie in der obigen Grafik dargestellt, beinhaltet das Modell dynamische Kodierungen\u00a0<strong>f\u00e4ngt den Trend effektiv ein und extrapoliert ihn<\/strong>, w\u00e4hrend das alternative Modell Schwierigkeiten hat, dies zu erreichen.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-13 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Nutzung und Grenzen<\/h2><\/div><div class=\"fusion-text fusion-text-23\"><p>Unsere Methode erweist sich als besonders wertvoll in Szenarien, in denen die Zeitreihe\u00a0<strong>ausgepr\u00e4gte Trends<\/strong>\u00a0und die\u00a0<strong>Vorhersagehorizont<\/strong> ist weit genug entfernt, um von der Trendextrapolation zu profitieren. Da wir au\u00dferdem dynamisch kodieren und einbeziehen\u00a0<strong>mehr kategorische Merkmale<\/strong>\u00a0mit\u00a0<strong>signifikant pr\u00e4diktiv<\/strong> <strong>Strom<\/strong>\u00a0in das Modell ein,\u00a0<strong>der durch unseren Ansatz erzielte Effekt auf Vorhersagen steigt<\/strong>. Es ist jedoch wichtig anzuerkennen, dass andere Kodierungsmethoden ihre eigenen Vorteile haben und in verschiedenen Kontexten vorteilhafter sein k\u00f6nnen. Au\u00dferdem besteht die M\u00f6glichkeit, beide Kodierungsarten zu kombinieren, um m\u00f6glicherweise bessere Ergebnisse zu erzielen.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-14 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Fazit<\/h2><\/div><ul style=\"--awb-line-height:27.2px;--awb-icon-width:27.2px;--awb-icon-height:27.2px;--awb-icon-margin:11.2px;--awb-content-margin:38.4px;\" class=\"fusion-checklist fusion-checklist-3 fusion-checklist-default type-icons paddingList dark-text\"><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">Herk\u00f6mmliche Kodierungstechniken f\u00fcr kategoriale Merkmale sind f\u00fcr Prognosen nicht ideal, insbesondere wenn Zeitreihen steile Trends aufweisen und der Prognosehorizont weit entfernt ist.<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Unsere Methode ist eine Abwandlung des Modellstapelns, denn wir verwenden ein Prophet-Modell - das sich durch \u00fcberlegene F\u00e4higkeiten bei der Modellierung und Extrapolation von Trends auszeichnet - um die Kodierung der kategorialen Merkmale zu konstruieren.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Unsere Experimente haben die Vorteile der Reduzierung von Verzerrungen und der Verbesserung der Vorhersagegenauigkeit gezeigt.<\/p>\n<\/div><\/li><\/ul><div class=\"fusion-text fusion-text-24\"><p>Wir haben vor, in den kommenden Monaten ein Papier zu ver\u00f6ffentlichen, das alle Einzelheiten unseres Ansatzes und der Umsetzung enthalten wird. <a href=\"https:\/\/www.artefact.com\/de\/blog\/\">Bleiben Sie dran<\/a> f\u00fcr weitere Updates!<\/p>\n<\/div><\/div><\/div><\/div><\/article><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-5 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-margin-top:40px;--awb-margin-bottom:40px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-center fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-4 fusion_builder_column_1_1 1_1 fusion-flex-column fusion-flex-align-self-center\" style=\"--awb-padding-top:40px;--awb-padding-right:40px;--awb-padding-bottom:40px;--awb-padding-left:40px;--awb-overflow:hidden;--awb-bg-position:left center;--awb-bg-size:cover;--awb-border-color:rgba(10,17,40,0.1);--awb-border-style:solid;--awb-border-radius:4px 4px 4px 4px;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper lazyload fusion-column-has-shadow fusion-flex-justify-content-center fusion-content-layout-column fusion-column-has-bg-image\" data-bg-url=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/background.jpg\" data-bg=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/background.jpg\"><div class=\"fusion-image-element\" style=\"text-align:center;--awb-margin-right:20px;--awb-margin-left:20px;--awb-max-width:150px;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-9 hover-type-none\"><img decoding=\"async\" width=\"72\" height=\"41\" title=\"mittel\" src=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%2772%27%20height%3D%2741%27%20viewBox%3D%270%200%2072%2041%27%3E%3Crect%20width%3D%2772%27%20height%3D%2741%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/medium.png\" alt class=\"lazyload img-responsive wp-image-60927\"\/><\/span><\/div><div class=\"fusion-title title fusion-title-15 fusion-sep-none fusion-title-center fusion-title-text fusion-title-size-three\" style=\"--awb-margin-top:20px;--awb-margin-bottom:0px;--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-center fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Mittel Blog von Artefact.<\/h3><\/div><div class=\"fusion-text fusion-text-25\" style=\"--awb-content-alignment:center;\"><p>Dieser Artikel wurde urspr\u00fcnglich ver\u00f6ffentlicht auf <strong>Medium.com<\/strong>.<br \/>\nFolgen Sie uns auf unserem Medium Blog !<\/p>\n<\/div><div style=\"text-align:center;\"><a class=\"fusion-button button-flat button-medium button-default fusion-button-default button-1 fusion-button-default-span fusion-button-default-type\" target=\"_blank\" rel=\"noopener noreferrer\" href=\"https:\/\/medium.com\/artefact-engineering-and-data-science\/encoding-categorical-features-in-forecasting-are-we-all-doing-it-wrong-fe8a9a6488da\"><span class=\"fusion-button-text awb-button__text awb-button__text--default\">Unseren Artikel lesen<\/span><\/a><\/div><\/div><\/div><\/div><\/div><\/p>","protected":false},"excerpt":{"rendered":"<p>Wir schlagen eine neuartige Methode zur Kodierung kategorischer Merkmale vor, die speziell auf Prognosen zugeschnitten ist.<\/p>","protected":false},"featured_media":71575,"parent":0,"template":"","meta":{"_acf_changed":false,"ep_exclude_from_search":false},"blog-category":[21939],"blog-language":[2991],"class_list":["post-71574","blog","type-blog","status-publish","has-post-thumbnail","hentry","blog-category-medium","blog-language-en"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/blog\/71574","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/blog"}],"about":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/types\/blog"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/media\/71575"}],"wp:attachment":[{"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/media?parent=71574"}],"wp:term":[{"taxonomy":"blog-category","embeddable":true,"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/blog-category?post=71574"},{"taxonomy":"blog-language","embeddable":true,"href":"https:\/\/www.artefact.com\/de\/wp-json\/wp\/v2\/blog-language?post=71574"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}