	{"id":71574,"date":"2023-07-05T14:29:02","date_gmt":"2023-07-05T13:29:02","guid":{"rendered":"https:\/\/www.artefact.com\/?post_type=blog&#038;p=71574"},"modified":"2024-09-20T17:45:57","modified_gmt":"2024-09-20T16:45:57","slug":"encoding-categorical-features-in-forecasting-are-we-all-doing-it-wrong","status":"publish","type":"blog","link":"https:\/\/www.artefact.com\/nl\/blog\/encoding-categorical-features-in-forecasting-are-we-all-doing-it-wrong\/","title":{"rendered":"Het coderen van categorische kenmerken in voorspellingen: doen we het allemaal verkeerd?"},"content":{"rendered":"<p><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-1 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling article-author\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-background-color:#ffffff;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-0 fusion_builder_column_1_2 1_2 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:50%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:50%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-1 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Auteur<\/h2><\/div><img decoding=\"async\" src=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%27150%27%20height%3D%270%27%20viewBox%3D%270%200%20150%200%27%3E%3Crect%20width%3D%27150%27%20height%3D%270%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Youssef-Oudghiri.jpeg\" alt=\"Image\" class=\"lazyload artefact-elegant-image align-left article-author-image\" style=\"width: 150px; border-radius: 54% 46% 77% 23% \/ 74% 40% 60% 26%; overflow: hidden;\" width=\"150\" height=\"auto\" \/><div class=\"fusion-title title fusion-title-2 fusion-sep-none fusion-title-text fusion-title-size-three article-author-name-title\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Youssef Oudghiri<\/h3><\/div><div class=\"fusion-text fusion-text-1 article-author-description\" style=\"--awb-text-transform:none;\"><p>Data Wetenschapper bij Artefact Frankrijk<\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-2 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-1 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-text fusion-text-2 description\"><p>Wij stellen een nieuwe methode voor het coderen van categorische kenmerken voor, die specifiek is afgestemd op voorspellingstoepassingen. In essentie codeert deze aanpak categorische kenmerken door de trend van de hoeveelheden geassocieerd met elke categorie te modelleren. In onze experimenten laat deze aanpak aanzienlijke prestatievoordelen zien - zowel in termen van voorspellingsnauwkeurigheid als bias - omdat boomgebaseerde ensemblemodellen beter trends kunnen modelleren en extrapoleren.<\/p>\n<\/div><\/div><\/div><\/div><\/div><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-3 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-margin-top:40px;--awb-margin-bottom:40px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-center fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-2 fusion_builder_column_1_1 1_1 fusion-flex-column fusion-flex-align-self-center fusion-column-inner-bg-wrapper\" style=\"--awb-padding-top:20px;--awb-padding-right:20px;--awb-padding-bottom:20px;--awb-padding-left:20px;--awb-overflow:hidden;--awb-inner-bg-size:cover;--awb-border-color:rgba(10,17,40,0.1);--awb-border-top:1px;--awb-border-right:1px;--awb-border-bottom:1px;--awb-border-left:1px;--awb-border-style:solid;--awb-border-radius:4px 4px 4px 4px;--awb-inner-bg-border-radius:4px 4px 4px 4px;--awb-inner-bg-overflow:hidden;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\" data-scroll-devices=\"small-visibility,medium-visibility,large-visibility\"><span class=\"fusion-column-inner-bg hover-type-none\"><a class=\"fusion-column-anchor\" href=\"https:\/\/medium.com\/artefact-engineering-and-data-science\/encoding-categorical-features-in-forecasting-are-we-all-doing-it-wrong-fe8a9a6488da\" rel=\"noopener noreferrer\" target=\"_blank\"><span class=\"fusion-column-inner-bg-image\"><\/span><\/a><\/span><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-center fusion-content-layout-row fusion-flex-align-items-center\"><div class=\"fusion-text fusion-text-3\"><p><u>Lees ons artikel over<\/u><\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-margin-right:20px;--awb-margin-left:20px;--awb-max-width:150px;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-1 hover-type-none\"><img decoding=\"async\" width=\"4000\" height=\"992\" title=\"Medium Blog\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog.png\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog.png\" alt class=\"lazyload img-responsive wp-image-60582\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%274000%27%20height%3D%27992%27%20viewBox%3D%270%200%204000%20992%27%3E%3Crect%20width%3D%274000%27%20height%3D%27992%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-200x50.png 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-400x99.png 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-600x149.png 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-800x198.png 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog-1200x298.png 1200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/04\/Medium-Blog.png 4000w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 4000px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-4\"><p>.<\/p>\n<\/div><\/div><\/div><\/div><\/div><article class=\"fusion-fullwidth fullwidth-box fusion-builder-row-4 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-flex-start fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-3 fusion_builder_column_1_1 1_1 fusion-flex-column\" style=\"--awb-bg-size:cover;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper fusion-column-has-shadow fusion-flex-justify-content-flex-start fusion-content-layout-column\"><div class=\"fusion-title title fusion-title-3 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Inleiding<\/h2><\/div><div class=\"fusion-text fusion-text-5\"><p>De motivatie voor dit werk kwam voort uit talrijke voorspellingsprojecten voor klanten bij Artefact waarbij onze boostingmodellen een hoge bias vertoonden op het moment van voorspellen. In een diagnostische fase stelden we vast dat een van de belangrijkste bronnen van vertekening in modellen voor ensembleleren voortkwam uit hun uitdaging om trends en fluctuerende niveaus nauwkeurig te modelleren.<\/p>\n<p>In het volgende zullen we het volgende aantonen\u00a0<strong>waarom<\/strong>\u00a0en\u00a0<strong>hoe<\/strong>\u00a0gebruikten we een nieuwe benadering voor het coderen van categorische kenmerken. Op basis van onze experimenten met een retailvoorspellingsproject van een klant en verschillende openbare datasets, bewijzen wij dat deze techniek de vertekening effectief kan verminderen en de nauwkeurigheid kan verbeteren.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-4 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Boosting en trends, waarom is het complex?<\/h2><\/div><div class=\"fusion-title title fusion-title-5 fusion-sep-none fusion-title-text fusion-title-size-three\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Boosting-algoritmen hebben het moeilijk om te extrapoleren<\/h3><\/div><div class=\"fusion-text fusion-text-6\"><p>Boosting-algoritmen hebben het moeilijk om trends te modelleren en te extrapoleren, omdat ze geen nieuwe waarden kunnen voorspellen die niet in de trainingsset voorkomen\/afwezig zijn in de bladeren. \u201c<a href=\"https:\/\/pypi.org\/project\/linear-tree\/\" target=\"_blank\" rel=\"noopener ugc nofollow\">Lineaire boom<\/a>\u201dOnze tests leverden echter geen overtuigende resultaten op met deze methode.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-6 fusion-sep-none fusion-title-text fusion-title-size-three\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Klassieke coderingen gaan in de richting van statische voorspellingen<\/h3><\/div><div class=\"fusion-text fusion-text-7\"><p>De meest gebruikte coderingsmethoden voor boosting bevorderen statische relaties tussen onafhankelijke en afhankelijke variabelen, wat op zijn beurt bijdraagt aan een grotere vertekening in de aanwezigheid van trends. Het onderstaande diagram illustreert dit fenomeen:<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-2 hover-type-none\"><img decoding=\"async\" width=\"1400\" height=\"477\" alt=\"Classical encodings push towards static predictions\" title=\"Klassieke coderingen gaan in de richting van statische voorspellingen\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Classical-encodings-push-towards-static-predictions.webp\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Classical-encodings-push-towards-static-predictions.webp\" class=\"lazyload img-responsive wp-image-71578\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%271400%27%20height%3D%27477%27%20viewBox%3D%270%200%201400%20477%27%3E%3Crect%20width%3D%271400%27%20height%3D%27477%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Classical-encodings-push-towards-static-predictions-200x68.webp 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Classical-encodings-push-towards-static-predictions-400x136.webp 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Classical-encodings-push-towards-static-predictions-600x204.webp 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Classical-encodings-push-towards-static-predictions-800x273.webp 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Classical-encodings-push-towards-static-predictions-1200x409.webp 1200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Classical-encodings-push-towards-static-predictions.webp 1400w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 1400px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-8\"><p style=\"text-align: center;\"><em>Vereenvoudigde visuele weergave van de statische aard van de codering van categorische kenmerken in boosting-algoritmen<\/em><\/p>\n<\/div><div class=\"fusion-text fusion-text-9\"><p>We erkennen dat de bovenstaande voorstelling een oversimplificatie is, aangezien beslisbomen complexer zijn en niet-lineaire relaties kunnen identificeren op basis van meerdere factoren. De voorwaarde \u201cde kleur is zwart\u201d zou inderdaad geassocieerd kunnen worden met \u201cde maand juni\u201d. In dit geval zou de kleur zwart niet altijd dezelfde impact hebben. Maar laten we eens naar het grotere geheel kijken:<\/p>\n<\/div><ul style=\"--awb-line-height:27.2px;--awb-icon-width:27.2px;--awb-icon-height:27.2px;--awb-icon-margin:11.2px;--awb-content-margin:38.4px;\" class=\"fusion-checklist fusion-checklist-1 fusion-checklist-default type-icons paddingList dark-text\"><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Het toewijzen van \u00e9\u00e9n impact voor de kleur zwart in juni is nog steeds niet ideaal, omdat de impact in juni 2021 kan verschillen van de impact in juni 2022. Zelfs als we het jaartal zouden opnemen, zou ten eerste de beslissingsgrens te complex worden om op te bouwen en te identificeren, maar ook, wat zou er gebeuren als de training data eindigt in 2022 en er voorspellingen moeten worden gedaan voor 2023?<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p><strong>Feature engineering is bedoeld om het model te helpen bij het gemakkelijker identificeren van relaties<\/strong>. Als we het model kunnen helpen om de impact van de kleur zwart op elk moment in de tijd te associ\u00ebren zonder dat er complexe relaties ge\u00efdentificeerd hoeven te worden, zou dat zeer voordelig zijn voor het model. Vandaar ...<\/p>\n<\/div><\/li><\/ul><div class=\"fusion-title title fusion-title-7 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Onze nieuwe benadering: Dynamische codering van categorische kenmerken<\/h2><\/div><div class=\"fusion-title title fusion-title-8 fusion-sep-none fusion-title-text fusion-title-size-three\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Basis van dynamische codering (v1 zonder itemniveau)<\/h3><\/div><div class=\"fusion-text fusion-text-10\"><p id=\"9918\" data-selectable-paragraph=\"\">In \u00e9\u00e9n zin kan onze methode voor het coderen van categorische kenmerken worden beschreven als:\u00a0<strong>we modelleren de trendcomponent van elke categorie en gebruiken deze trendwaarden om dat categorische kenmerk te coderen<\/strong>.<\/p>\n<p id=\"b6c1\" data-selectable-paragraph=\"\">Het onderstaande diagram illustreert het verschil tussen een statische gemiddelde codering en een trendgebaseerde codering voor twee kleurcategorie\u00ebn: zwart en goud.<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-3 hover-type-none\"><img decoding=\"async\" width=\"1400\" height=\"453\" title=\"Basis van dynamische codering (v1 zonder itemniveau)\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Basis-of-dynamic-encoding-v1-without-item-level.webp\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Basis-of-dynamic-encoding-v1-without-item-level.webp\" alt class=\"lazyload img-responsive wp-image-71579\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%271400%27%20height%3D%27453%27%20viewBox%3D%270%200%201400%20453%27%3E%3Crect%20width%3D%271400%27%20height%3D%27453%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Basis-of-dynamic-encoding-v1-without-item-level-200x65.webp 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Basis-of-dynamic-encoding-v1-without-item-level-400x129.webp 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Basis-of-dynamic-encoding-v1-without-item-level-600x194.webp 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Basis-of-dynamic-encoding-v1-without-item-level-800x259.webp 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Basis-of-dynamic-encoding-v1-without-item-level-1200x388.webp 1200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Basis-of-dynamic-encoding-v1-without-item-level.webp 1400w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 1400px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-11\"><p style=\"text-align: center;\"><em>Illustratie van het dynamische coderingsprincipe, dat trendmodellering voor elke categorie inhoudt<\/em><\/p>\n<\/div><div class=\"fusion-text fusion-text-12\"><p id=\"8d62\" data-selectable-paragraph=\"\">In onze experimenten hebben we ervoor gekozen om Prophet te gebruiken voor het extraheren van de trendcomponent. Natuurlijk is het ook mogelijk om andere voorspellingsmodellen voor tijdreeksen te gebruiken.<\/p>\n<p id=\"5677\" data-selectable-paragraph=\"\">Merk op dat de statische gemiddelde codering impliceert dat de verkoop van zwarte artikelen op elk moment gemiddeld 100 eenheden\/maand bedraagt. De dynamische codering daarentegen maakt het mogelijk om de stijgende trend in de verkoop van zwarte artikelen te verklaren en is in staat om deze in de toekomst te extrapoleren. Een soortgelijke verklaring kan worden gemaakt met betrekking tot gouden voorwerpen. Onze aanpak zal dus vooral nuttig zijn in datasets waarbij de te voorspellen doelvariabele steile trends volgt in de verschillende beschikbare categorie\u00ebn.<\/p>\n<p id=\"096b\" data-selectable-paragraph=\"\">Onze primaire focus is om het model in staat te stellen zich gemakkelijker aan te passen aan de veranderende relaties tussen onafhankelijke variabelen en de afhankelijke variabele die voorspeld moet worden. Daarom kan deze dynamische coderingsmethode ook worden toegepast op numerieke kenmerken. Neem het voorbeeld van de prijs. Hoewel de prijs numeriek is en het model er direct regels op kan baseren, kan de voorkeur van mensen voor goedkope of dure artikelen nog steeds evolueren in de tijd en een specifieke verkooptrend volgen. In de context van een economische crisis kunnen betaalbare producten bijvoorbeeld een stijgende verkooptrend volgen, terwijl dure producten een dalende trend kunnen volgen. Als we \u2018betaalbaar\u2019 als \u00e9\u00e9n categorie beschouwen en \u2018duur\u2019 als een andere, zouden we een dynamische codering voor het prijskenmerk kunnen voorstellen, net zoals we voor kleuren hebben gedaan.<\/p>\n<p id=\"671a\" data-selectable-paragraph=\"\">Het is belangrijk om op te merken dat voor numerieke kenmerken zowel de basisvariabelen als de dynamisch gecodeerde variabelen in het model gebruikt kunnen worden, aangezien ze verschillende soorten informatie zullen verschaffen.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-9 fusion-sep-none fusion-title-text fusion-title-size-three\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Meer belang hechten aan dynamische functies (v2 met itemniveau)<\/h3><\/div><div class=\"fusion-text fusion-text-13\"><p id=\"c481\" data-selectable-paragraph=\"\">Hoewel deze nieuwe coderingsmethode een verbetering is, is het belang van categorische kenmerken vaak niet groot genoeg om voorspellingen significant te be\u00efnvloeden wanneer we de belang van kenmerken onderzoeken. Om de dynamische kenmerken meer belang te geven en zo een betere modellering en extrapolatie van trends te bevorderen, passen we de coderingswaarden aan elke tijdreeks \/ elk item afzonderlijk aan.<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-4 hover-type-none\"><img decoding=\"async\" width=\"1342\" height=\"296\" title=\"Meer belang hechten aan dynamische functies (v2 met itemniveau)\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Giving-more-importance-to-dynamic-features-v2-with-item-level.webp\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Giving-more-importance-to-dynamic-features-v2-with-item-level.webp\" alt class=\"lazyload img-responsive wp-image-71580\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%271342%27%20height%3D%27296%27%20viewBox%3D%270%200%201342%20296%27%3E%3Crect%20width%3D%271342%27%20height%3D%27296%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Giving-more-importance-to-dynamic-features-v2-with-item-level-200x44.webp 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Giving-more-importance-to-dynamic-features-v2-with-item-level-400x88.webp 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Giving-more-importance-to-dynamic-features-v2-with-item-level-600x132.webp 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Giving-more-importance-to-dynamic-features-v2-with-item-level-800x176.webp 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Giving-more-importance-to-dynamic-features-v2-with-item-level-1200x265.webp 1200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Giving-more-importance-to-dynamic-features-v2-with-item-level.webp 1342w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 1342px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-14\"><p style=\"text-align: center;\"><em>Formule die de twee componenten van dynamisch coderen weergeeft: categorieniveau en itemniveau<\/em><\/p>\n<\/div><div class=\"fusion-text fusion-text-15\"><p>Om terug te komen op ons kleurenvoorbeeld: gegeven twee verschillende zwarte items, kan de dynamische codering van de \u201czwarte\u201d categorie voor elk item anders zijn op basis van de individuele verkoop in het verleden.<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-5 hover-type-none\"><img decoding=\"async\" width=\"1400\" height=\"587\" alt=\"Table illustrating the calculation of dynamic encoding through a simple example\" title=\"Tabel ter illustratie van de berekening van dynamische codering aan de hand van een eenvoudig voorbeeld\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Table-illustrating-the-calculation-of-dynamic-encoding-through-a-simple-example.webp\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Table-illustrating-the-calculation-of-dynamic-encoding-through-a-simple-example.webp\" class=\"lazyload img-responsive wp-image-71582\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%271400%27%20height%3D%27587%27%20viewBox%3D%270%200%201400%20587%27%3E%3Crect%20width%3D%271400%27%20height%3D%27587%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Table-illustrating-the-calculation-of-dynamic-encoding-through-a-simple-example-200x84.webp 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Table-illustrating-the-calculation-of-dynamic-encoding-through-a-simple-example-400x168.webp 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Table-illustrating-the-calculation-of-dynamic-encoding-through-a-simple-example-600x252.webp 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Table-illustrating-the-calculation-of-dynamic-encoding-through-a-simple-example-800x335.webp 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Table-illustrating-the-calculation-of-dynamic-encoding-through-a-simple-example-1200x503.webp 1200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/Table-illustrating-the-calculation-of-dynamic-encoding-through-a-simple-example.webp 1400w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 1400px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-16\"><p style=\"text-align: center;\"><em>Tabel ter illustratie van de berekening van dynamische codering aan de hand van een eenvoudig voorbeeld<\/em><\/p>\n<\/div><div class=\"fusion-title title fusion-title-10 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Experimenten en resultaten<\/h2><\/div><div class=\"fusion-title title fusion-title-11 fusion-sep-none fusion-title-text fusion-title-size-three\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Klant dataset<\/h3><\/div><div class=\"fusion-text fusion-text-17\"><p>We hebben onze aanpak gebruikt om de verkoop te voorspellen voor een van onze klanten in de detailhandel. We hebben onze methode grondig gevalideerd over een uitgebreide reeks toepassingsgebieden om de effectiviteit ervan te garanderen. Hier zijn enkele data punten met betrekking tot de experimentele context:<\/p>\n<\/div><ul style=\"--awb-line-height:27.2px;--awb-icon-width:27.2px;--awb-icon-height:27.2px;--awb-icon-margin:11.2px;--awb-content-margin:38.4px;\" class=\"fusion-checklist fusion-checklist-2 fusion-checklist-default type-icons paddingList dark-text\"><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">Er werden experimenten uitgevoerd met 9 verschillende productscopes, met \u00e9\u00e9n boosting (LightGBM) model voor elke scope.<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Voor elk bereik werd een k-voudige kruisvalidatie met een uitdijend venster uitgevoerd (k=5).<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Voorspellingshorizon: Dag+1 tot Dag+180.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>De prestaties werden beoordeeld aan de hand van twee maatstaven:<\/p>\n<\/div><\/li><\/ul><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-6 hover-type-none\"><img decoding=\"async\" width=\"1400\" height=\"329\" title=\"formule\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/formule.webp\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/formule.webp\" alt class=\"lazyload img-responsive wp-image-71583\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%271400%27%20height%3D%27329%27%20viewBox%3D%270%200%201400%20329%27%3E%3Crect%20width%3D%271400%27%20height%3D%27329%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/formule-200x47.webp 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/formule-400x94.webp 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/formule-600x141.webp 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/formule-800x188.webp 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/formule-1200x282.webp 1200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/formule.webp 1400w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 1400px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-18\"><p id=\"3f94\" data-selectable-paragraph=\"\">Over het algemeen bleek de methode zeer effici\u00ebnt te zijn,\u00a0<strong>wat resulteert in een gemiddelde absolute afname in vertekening van 9.82% en een gemiddelde absolute toename in voorspellingsnauwkeurigheid van 6.29%<\/strong>\u00a0over de 9 productbereiken en 5 kruisvalidatievouwen.<\/p>\n<p id=\"22b9\" data-selectable-paragraph=\"\">De volgende sectie valideert de relevantie van onze methode door deze te testen op een openbare dataset.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-12 fusion-sep-none fusion-title-text fusion-title-size-three\" style=\"--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Openbare winkelverkoop dataset<\/h3><\/div><div class=\"fusion-text fusion-text-19\"><p id=\"fbf3\" data-selectable-paragraph=\"\">In deze vereenvoudigde casestudy gebruiken we de\u00a0<a href=\"https:\/\/www.kaggle.com\/competitions\/store-sales-time-series-forecasting\/data\" target=\"_blank\" rel=\"noopener ugc nofollow\">Winkelverkoop - Tijdreeksvoorspelling<\/a>\u00a0Kaggle dataset. Deze dataset vertoont een steile trend bij het onderzoeken van de gemiddelde verkooptijdreeksen, waardoor onze methode bijzonder relevant is. Bovendien is de gekozen voorspellingshorizon drie maanden, wat ver genoeg is om te profiteren van de extra extrapolatiemogelijkheden van de dynamische codering. Voor demonstratiedoeleinden beperken we de dataset tot 31 maart 2016, vlak voordat er een aardbeving plaatsvond, waardoor de verkoopcurve afvlakte.<\/p>\n<p id=\"2ec5\" data-selectable-paragraph=\"\">Voorafgaand aan de codering bestaat onze initi\u00eble dataset uit ongeveer 75% numerieke kenmerken, waaronder vertragingen, voortschrijdende gemiddelden, kalenderkenmerken en vakantiegebeurtenissen. De resterende 25% bestaan uit categorische kenmerken zoals productfamilie, winkelnummer, stad en andere.<\/p>\n<p id=\"f0f6\" data-selectable-paragraph=\"\">Er worden twee verschillende modellen getraind: het ene gebruikt de categoriale kenmerken die dynamisch gecodeerd werden met onze aangepaste methode, terwijl het andere LightGBM's eigen verwerking van categoriale kenmerken gebruikt.<\/p>\n<p id=\"f3b9\" data-selectable-paragraph=\"\">Bij het vergelijken van hun prestaties zien we een aanzienlijke verbetering in de dynamische coderingsaanpak. De volgende tabel geeft een samenvatting van de resultaten:<\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-7 hover-type-none\"><img decoding=\"async\" width=\"1222\" height=\"272\" alt=\"Comparison of RMSE, FA, and %Bias between LightGBM encoding method and dynamic encoding\" title=\"afbeelding 1\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image-1.webp\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image-1.webp\" class=\"lazyload img-responsive wp-image-71584\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%271222%27%20height%3D%27272%27%20viewBox%3D%270%200%201222%20272%27%3E%3Crect%20width%3D%271222%27%20height%3D%27272%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image-1-200x45.webp 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image-1-400x89.webp 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image-1-600x134.webp 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image-1-800x178.webp 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image-1-1200x267.webp 1200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image-1.webp 1222w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 1222px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-20\"><p style=\"text-align: center;\"><em>Vergelijking van RMSE, FA en %Bias tussen LightGBM-coderingsmethode en dynamische codering<\/em><\/p>\n<\/div><div class=\"fusion-image-element\" style=\"--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-8 hover-type-none\"><img decoding=\"async\" width=\"1304\" height=\"364\" title=\"afbeelding2\" src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image2.webp\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image2.webp\" alt class=\"lazyload img-responsive wp-image-71585\" srcset=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%271304%27%20height%3D%27364%27%20viewBox%3D%270%200%201304%20364%27%3E%3Crect%20width%3D%271304%27%20height%3D%27364%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-srcset=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image2-200x56.webp 200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image2-400x112.webp 400w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image2-600x167.webp 600w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image2-800x223.webp 800w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image2-1200x335.webp 1200w, https:\/\/www.artefact.com\/\/wp-content\/uploads\/2023\/07\/image2.webp 1304w\" data-sizes=\"auto\" data-orig-sizes=\"(max-width: 640px) 100vw, 1304px\" \/><\/span><\/div><div class=\"fusion-text fusion-text-21\"><p style=\"text-align: center;\"><em>Gemiddelde wekelijkse verkoop + 3 maanden voorspellingen (dynamische codering vs LightGBM coderingsmethode)<br \/>\n<\/em><\/p>\n<\/div><div class=\"fusion-text fusion-text-22\"><p>Zoals weergegeven in de bovenstaande grafiek, bevat het model met dynamische coderingen\u00a0<strong>vangt effectief de trend en extrapoleert deze<\/strong>, terwijl het alternatieve model moeite heeft om dit te bereiken.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-13 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Gebruik en limieten<\/h2><\/div><div class=\"fusion-text fusion-text-23\"><p>Onze methode blijkt vooral waardevol te zijn in scenario's waar de tijdreeks\u00a0<strong>uitgesproken trends<\/strong>\u00a0en de\u00a0<strong>voorspellingshorizon<\/strong> ver genoeg weg is om te profiteren van extrapolatie van trends. Bovendien coderen en integreren we dynamisch\u00a0<strong>meer categorische kenmerken<\/strong>\u00a0met\u00a0<strong>significant voorspellend<\/strong> <strong>stroom<\/strong>\u00a0in het model,\u00a0<strong>het effect van onze aanpak op voorspellingen neemt toe<\/strong>. Het is echter belangrijk om te erkennen dat andere coderingsmethoden hun eigen voordelen hebben en in verschillende contexten voordeliger kunnen zijn. Bovendien bestaat de mogelijkheid om beide coderingstypes te combineren voor mogelijk betere resultaten.<\/p>\n<\/div><div class=\"fusion-title title fusion-title-14 fusion-sep-none fusion-title-text fusion-title-size-two\" style=\"--awb-margin-bottom-small:8px;\"><h2 class=\"fusion-title-heading title-heading-left fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:50;line-height:1.2;\">Conclusie<\/h2><\/div><ul style=\"--awb-line-height:27.2px;--awb-icon-width:27.2px;--awb-icon-height:27.2px;--awb-icon-margin:11.2px;--awb-content-margin:38.4px;\" class=\"fusion-checklist fusion-checklist-3 fusion-checklist-default type-icons paddingList dark-text\"><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">Conventionele coderingstechnieken voor categorische kenmerken zijn niet ideaal voor voorspellingen, vooral wanneer tijdreeksen steile trends vertonen en de voorspellingshorizon ver weg is.<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Onze methode is een variatie op het stapelen van modellen, omdat we een Prophet-model gebruiken - dat over superieure mogelijkheden beschikt om trends te modelleren en te extrapoleren - om de codering van de categorische kenmerken te construeren.<\/p>\n<\/div><\/li><li class=\"fusion-li-item\" style=\"\"><span class=\"icon-wrapper circle-no\"><i class=\"fusion-li-icon awb-icon-check\" aria-hidden=\"true\"><\/i><\/span><div class=\"fusion-li-item-content\">\n<p>Onze experimenten toonden de voordelen aan van het verminderen van vertekeningen en het verbeteren van de nauwkeurigheid van voorspellingen.<\/p>\n<\/div><\/li><\/ul><div class=\"fusion-text fusion-text-24\"><p>We zijn van plan om in de komende maanden een document te publiceren met alle details over onze aanpak en implementatie. <a href=\"https:\/\/www.artefact.com\/nl\/blog\/\">Blijf op de hoogte<\/a> voor verdere updates!<\/p>\n<\/div><\/div><\/div><\/div><\/article><div class=\"fusion-fullwidth fullwidth-box fusion-builder-row-5 fusion-flex-container nonhundred-percent-fullwidth non-hundred-percent-height-scrolling\" style=\"--awb-border-radius-top-left:0px;--awb-border-radius-top-right:0px;--awb-border-radius-bottom-right:0px;--awb-border-radius-bottom-left:0px;--awb-margin-top:40px;--awb-margin-bottom:40px;--awb-flex-wrap:wrap;\" ><div class=\"fusion-builder-row fusion-row fusion-flex-align-items-center fusion-flex-justify-content-center fusion-flex-content-wrap\" style=\"max-width:calc( 1440px + 20px );margin-left: calc(-20px \/ 2 );margin-right: calc(-20px \/ 2 );\"><div class=\"fusion-layout-column fusion_builder_column fusion-builder-column-4 fusion_builder_column_1_1 1_1 fusion-flex-column fusion-flex-align-self-center\" style=\"--awb-padding-top:40px;--awb-padding-right:40px;--awb-padding-bottom:40px;--awb-padding-left:40px;--awb-overflow:hidden;--awb-bg-position:left center;--awb-bg-size:cover;--awb-border-color:rgba(10,17,40,0.1);--awb-border-style:solid;--awb-border-radius:4px 4px 4px 4px;--awb-width-large:100%;--awb-margin-top-large:0px;--awb-spacing-right-large:10px;--awb-margin-bottom-large:0px;--awb-spacing-left-large:10px;--awb-width-medium:100%;--awb-order-medium:0;--awb-spacing-right-medium:10px;--awb-spacing-left-medium:10px;--awb-width-small:100%;--awb-order-small:0;--awb-spacing-right-small:10px;--awb-spacing-left-small:10px;\"><div class=\"fusion-column-wrapper lazyload fusion-column-has-shadow fusion-flex-justify-content-center fusion-content-layout-column fusion-column-has-bg-image\" data-bg-url=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/background.jpg\" data-bg=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/background.jpg\"><div class=\"fusion-image-element\" style=\"text-align:center;--awb-margin-right:20px;--awb-margin-left:20px;--awb-max-width:150px;--awb-caption-title-font-family:var(--h2_typography-font-family);--awb-caption-title-font-weight:var(--h2_typography-font-weight);--awb-caption-title-font-style:var(--h2_typography-font-style);--awb-caption-title-size:var(--h2_typography-font-size);--awb-caption-title-transform:var(--h2_typography-text-transform);--awb-caption-title-line-height:var(--h2_typography-line-height);--awb-caption-title-letter-spacing:var(--h2_typography-letter-spacing);\"><span class=\"fusion-imageframe imageframe-none imageframe-9 hover-type-none\"><img decoding=\"async\" width=\"72\" height=\"41\" title=\"middelgrote\" src=\"data:image\/svg+xml,%3Csvg%20xmlns%3D%27http%3A%2F%2Fwww.w3.org%2F2000%2Fsvg%27%20width%3D%2772%27%20height%3D%2741%27%20viewBox%3D%270%200%2072%2041%27%3E%3Crect%20width%3D%2772%27%20height%3D%2741%27%20fill-opacity%3D%220%22%2F%3E%3C%2Fsvg%3E\" data-orig-src=\"https:\/\/www.artefact.com\/\/wp-content\/uploads\/2021\/03\/medium.png\" alt class=\"lazyload img-responsive wp-image-60927\"\/><\/span><\/div><div class=\"fusion-title title fusion-title-15 fusion-sep-none fusion-title-center fusion-title-text fusion-title-size-three\" style=\"--awb-margin-top:20px;--awb-margin-bottom:0px;--awb-margin-bottom-small:8px;\"><h3 class=\"fusion-title-heading title-heading-center fusion-responsive-typography-calculated\" style=\"margin:0;--fontSize:20;line-height:1.2;\">Medium Blog bij Artefact.<\/h3><\/div><div class=\"fusion-text fusion-text-25\" style=\"--awb-content-alignment:center;\"><p>Dit artikel werd oorspronkelijk gepubliceerd op <strong>Medium.com<\/strong>.<br \/>\nVolg ons op ons medium Blog !<\/p>\n<\/div><div style=\"text-align:center;\"><a class=\"fusion-button button-flat button-medium button-default fusion-button-default button-1 fusion-button-default-span fusion-button-default-type\" target=\"_blank\" rel=\"noopener noreferrer\" href=\"https:\/\/medium.com\/artefact-engineering-and-data-science\/encoding-categorical-features-in-forecasting-are-we-all-doing-it-wrong-fe8a9a6488da\"><span class=\"fusion-button-text awb-button__text awb-button__text--default\">Lees ons artikel<\/span><\/a><\/div><\/div><\/div><\/div><\/div><\/p>","protected":false},"excerpt":{"rendered":"<p>Wij stellen een nieuwe methode voor om categorische kenmerken te coderen, die specifiek is afgestemd op voorspellingstoepassingen.<\/p>","protected":false},"featured_media":71575,"parent":0,"template":"","meta":{"_acf_changed":false,"ep_exclude_from_search":false},"blog-category":[21939],"blog-language":[2991],"class_list":["post-71574","blog","type-blog","status-publish","has-post-thumbnail","hentry","blog-category-medium","blog-language-en"],"acf":[],"_links":{"self":[{"href":"https:\/\/www.artefact.com\/nl\/wp-json\/wp\/v2\/blog\/71574","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.artefact.com\/nl\/wp-json\/wp\/v2\/blog"}],"about":[{"href":"https:\/\/www.artefact.com\/nl\/wp-json\/wp\/v2\/types\/blog"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.artefact.com\/nl\/wp-json\/wp\/v2\/media\/71575"}],"wp:attachment":[{"href":"https:\/\/www.artefact.com\/nl\/wp-json\/wp\/v2\/media?parent=71574"}],"wp:term":[{"taxonomy":"blog-category","embeddable":true,"href":"https:\/\/www.artefact.com\/nl\/wp-json\/wp\/v2\/blog-category?post=71574"},{"taxonomy":"blog-language","embeddable":true,"href":"https:\/\/www.artefact.com\/nl\/wp-json\/wp\/v2\/blog-language?post=71574"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}