Forecasting something that never happened: how we estimated past promotions profitability

Ein Leitfaden zur Verwendung kontrafaktischer Prognosen zur Schätzung der Kosteneffizienz vergangener In-Store-Promotions im Einzelhandel.

Autor

Luca SERRA

Data Wissenschaftler

Lesen Sie unseren Artikel über

Im Rahmen eines 3-monatigen Praxisprojekts haben wir ein kontrafaktisches Prognosemodell entwickelt und industrialisiert (zunächst mit Prophet, dann mit XGBoost), um die Leistung vergangener In-Store-Promotions einer Ladenkette zu bewerten und so die Bedarfsplaner bei der Auswahl von Werbekampagnen zu unterstützen.

Dieses Modell wird trainiert und prognostiziert dann hypothetische Verkäufe (genannt Baseline) in der Vergangenheit, wenn es keine Promotion gegeben hätte. Die Differenz zwischen den tatsächlichen Promotion-Verkäufen und dieser Basislinie ergibt den inkrementellen Umsatz, den wir Uplift nennen.

Dank handgefertigter zeitlicher Merkmale erreichten wir eine Vorhersagegenauigkeit von fast 90%.

Geschäftlicher Kontext

Bei der Planung zukünftiger Werbekampagnen müssen Bedarfsplaner entscheiden, welche Produktsortimente mit einem bestimmten Werbemechanismus rabattiert werden sollen (z.B. “-15%”, “Kaufen Sie 2, erhalten Sie 1 gratis” usw...)

Dies sind schwierige Entscheidungen, denn:

Entscheiden Sie sich für zu viele Werbeaktionen würde nicht sein eine effektiv Strategie (die Kunden gewöhnen sich an Werbeaktionen und warten eher auf die nächste).
Die Wahl der falsche Promotionen würde zu Ausfällen führen und Verluste.

Für die meisten Einzelhandelsunternehmen ist die Kampagnenwahlen gemacht werden auf der Grundlage ihrer Geschäftskenntnisse und die Leistung früherer Beförderungen. Allerdings ist die “Leistung der vergangenen Beförderungen” ist schwer zu schätzen. In der Tat steigern Werbekampagnen den Umsatz (in den meisten Fällen), aber wie lässt sich die Effizienz oder der Return On Investment (ROI) abschätzen, wenn wir nicht wissen, wie hoch der Umsatz ohne eine Werbeaktion gewesen wäre? Dieser hypothetische Wert des Umsatzes ohne Promotion kann als Grundlinie. Mit anderen Worten: Es geht darum, die inkrementelle Verkäufe (oder Aufzug) einer Werbekampagne, die dem tatsächliche Verkäufe, abzüglich der Basislinie.

Um diese Frage zu beantworten, haben wir ein Tool entwickelt, mit dem wir den Verkaufsanstieg vergangener Kampagnen mit einer Genauigkeit von fast 90% abschätzen konnten.
Diese Aufgabe ist recht anspruchsvoll, da das Ziel darin besteht, Prognosen über hypothetische Umsatz in einer anderen Situation (hier, wenn die Werbekampagne für ein bestimmtes Produkt nicht stattgefunden hätte). Dies kann man als “kontrafaktische Vorhersage”. Dieser Artikel basiert hauptsächlich auf unseren Erfahrungen bei einem Projekt, das wir für eine französische Ladenkette durchgeführt haben.

Er soll den von uns verwendeten Ansatz beschreiben und Tipps und Vorbehalte bei der Implementierung einer kontrafaktischen Prognoselösung geben (data Vorbereitung, Modellierung), erklären Sie die Bewertung Prozess und diskutieren schließlich die Grenzen und nächste Schritte zu diesem Ansatz.

Was ist eine kontrafaktische Vorhersage und warum ist sie schwierig vorherzusagen?

Die kontrafaktische Vorhersage ist der Prozess der Vorhersage von etwas in der Form: Was würde X wäre, wenn es keine Y. In unserem Anwendungsfall, X wäre der Verkauf und Y wäre eine Werbekampagne.

Es gibt tatsächlich mehrere Felder wo dieses Verfahren angewendet werden kann: Bestandsunterdeckung (Schätzung des Fehlbetrages aufgrund von nicht vorrätigen Artikeln), alle besondere Ereignisse, die nicht allzu lange dauern (Covid: funktioniert nicht!), um genügend data zu haben, um diese kontrafaktische Situation zu schätzen.

Das Beförderungsproblem kann unter 3 Gesichtspunkten angegangen werden (sortiert nach aufsteigender Schwierigkeit):

1. Verstehen vergangener Beförderungen: die Leistung (z. B. Umsatzsteigerung oder ROI) früherer Werbekampagnen gründlich zu bewerten.
2. Vorhersage die Leistung von zukünftige Förderung Kampagnen anhand ihrer Merkmale (rabattierte Produkte, Start- und Enddatum, Mechanismus...)
3. Optimierung des Promotionsplans: Ermittlung der besten Aufstellung zukünftiger Werbeaktionen zur Maximierung einer Geschäftskennzahl.

In diesem Artikel, werden wir uns auf den ersten Schritt konzentrieren da dies das Ziel unseres Projekts war. In den folgenden Abschnitten geben wir Ihnen jedoch einige Hinweise darauf, wie Sie die nächsten beiden Punkte angehen können.

Es gibt zwei Hauptgründe, die die Aufgabe der kontrafaktischen Vorhersage zu einem schwierigen Prozess machen:

Es gibt eine Mangel an Literatur oder Beispielen zu diesem Thema, während es im Einzelhandel und anderen Branchen sehr nützlich ist.
Bei kontrafaktischen Prognosen, es gibt keine grundlegende Wahrheit, denn es ist etwas, das nicht passiert ist. Daher scheint die Leistungsbewertung recht schwierig zu sein (glücklicherweise haben wir einen Ansatz entwickelt, der im Abschnitt Bewertung vorgestellt wird).

Vorgeschlagener Ansatz

Der Ansatz, den wir bei der Entwicklung unseres Tools verwendet haben, ist der folgende:

1. Zug eine Vorhersage Modell für Termine außerhalb der Promotion, um zu erfahren, wie die Umsätze ohne geplante Werbeaktionen aussehen sollten.
2. Voraussagen auf alle data-Punkte (eigentlich werden nur die Vorhersagen während der Aktion verwendet, aber es kann gut sein, die Vorhersagen überall zu behalten, um sie zu interpretieren).
3. Vergleichen Sie die vorhergesagte Basislinie zu den tatsächlichen Verkäufen während jeder Werbeaktion, um daraus den Uplift abzuleiten.

Wichtiger Hinweis: Das Ziel ist es, die Prognosen während der in der Vergangenheit liegenden Aktionszeiträume zu nutzen. Denn diese Aufgabe ist eine a posteriori Analyse dass es im Gegensatz zur klassischen Vorhersage möglich, an Terminen zu trainieren, die nach den Zeitraum der Inferenz, entsprechend der Werbekampagne. Es gibt hier keinen Begriff von data Leckage, da wir versuchen, ein Phänomen zu erklären, das in der Vergangenheit passiert ist. Der Arbeitsablauf zwischen Training und Schlussfolgerung sieht also wie folgt aus:

Implementierung

Vorbereiten des data

Um das Problem der Werbung zu lösen, müssen Sie das richtige data-Format verwenden. Normalerweise haben wir Zugang zu zwei Arten von data:

1. Werbegeschenk data (beschreibende Informationen zu Werbeaktionen)

2. Verkauf data.

Die vorverarbeitete data ist im Grunde die data der Verkäufe, angereichert mit Aktionsinformationen (linke Verknüpfung, siehe Abbildung oben). Jede Zeile mit einem “Promo-Typ” ungleich Null entspricht einem Tag, an dem das Produkt im Angebot ist.

Bevor Sie die erste Implementierung vornehmen, ist es wichtig, dass Sie die Qualität des data bewerten. Hier finden Sie einige Richtlinien für die durchzuführenden Kontrollen:

1. Suchen Sie nach wichtigen Ausgaben im Zeitreihen:

Intermittierend und/oder sehr geringe Umsätze (es wird schwer sein, eine Basislinie zu lernen).
Werbeaktionen dauern zu lange und/oder zu häufig sind (also nicht genügend data-Punkte zum Trainieren).
Einige Produkte sind in mehrere Promotionen zur gleichen Zeit (welche Werbung ist für diese zusätzlichen Verkäufe verantwortlich?)

2. Definieren Sie eine Granularität für den Anwendungsfall:

Zeit Granularität: Soll die Analyse täglich oder wöchentlich erfolgen?
Artikel Granularität: eine Zeitreihe pro Artikel? Nach Familie von Artikeln? Manchmal können Sie die Granularität nicht reduzieren, wenn die Anzahl der verkauften Einheiten pro Zeitelement nicht hoch genug ist oder wenn die Zeitreihe zu unregelmäßig ist. Die aggregierte Verkäufe wird sein Glattere, mit weniger Lautstärkeproblemen, aber sie werden manchmal mangelnde Interpretierbarkeit.

Wenn die Zeitreihen also sauber genug sind, ist es ein guter Ausgangspunkt, einen möglichst granularen Ansatz zu wählen (z.B. Produkt X Tag, insbesondere wenn Sie mit Prophet arbeiten, wie wir es in diesem Projekt getan haben).

3. Mit einer klarer Umfang der FörderungWelche Produkte/Familien von Produkten sind Teil einer bestimmten Werbeaktion? Sind die Werbeaktionen auf nationaler Ebene geplant? (Wenn nicht, kann man z.B. nicht die Verkäufe eines Produkts in allen Geschäften eines Landes aggregieren).

Nachdem das data geprüft und vorbereitet wurde, ist es Zeit für die Modellierung.

Modellierung

Erste Iterationen und wichtige Erkenntnisse

Wir gestartet unsere ersten Iterationen mit Prophet weil es uns ermöglichte, eine Grundlinie sehr schnell, einfach hinzufügen Regressoren, und interpretieren die Ergebnisse natürlich (dank der additiven Zerlegung).

Hier finden Sie eine Zusammenfassung der wichtigsten Iterationsverbesserungen, die wir während des Projekts vorgenommen haben:

Im Grunde genommen, die wichtigste Verbesserungen kamen aus dem Regressoren haben wir hinzugefügt:

Die Handhabung von Besondere Ereignisse (Der Schwarze Freitag war besonders wichtig)
Zeitliche Verzögerungen (auch wenn das Prophet-Modell autoregressiv ist, haben wir Lags für vergangene und zukünftige Verkäufe hinzugefügt, was sich für die Genauigkeit des Modells als sehr nützlich erwiesen hat).

Schließlich hat auch die Anpassung der Art und Weise, wie wir die Vorhersagegenauigkeit gemessen haben (siehe Abschnitt "Bewertung" weiter unten), dazu beigetragen, dass wir die Leistung genauer bewerten können.

Warum haben wir zu XGBoost gewechselt?

Trotz der guten Leistung und Interpretierbarkeit von Prophet haben wir festgestellt, dass XGBoost war am besten geeignet, und zwar aus mehreren Gründen:

Wir hatten mehr als 1000 Zeitreihen bedeutet also mehr als 1000 Prophet-Modelle zu trainieren.
Prophet hat Verständnisprobleme nicht-lineare Beziehungen zwischen Merkmalen und ihren Auswirkungen auf das Ziel. Diese Merkmal Kreuz Problem ist gut beschrieben in dieser Artikel.
Wir haben die gleiche Leistung während Reduzierung um einem Faktor von 10 die Trainingszeit.

Bewertung und Grenzen

Bewertung

Wie bereits erwähnt, gibt es bei kontrafaktischen Prognosen keine Grundwahrheit, was die Leistungsbewertung komplexer macht als bei klassischen Prognosen.

Wir haben jedoch einen Weg gefunden, unsere Leistung zu messen, oder besser gesagt, sie so genau wie möglich zu schätzen. Und so geht's:

Bei klassischen Prognosen messen wir die Leistung in der Regel anhand eines Kreuzvalidierung Strategie (hier, expandierendes Fenster) für einen bestimmten Validierungszeitraum (z.B. das letzte Jahr des verfügbaren data). Für diesen Validierungszeitraum verschiebt sich das tatsächliche Fenster, in dem wir die Leistung messen, in jeder Falte (“Bewertungsfenster”), und das vordere data wird für die Verzögerungsmerkmale verwendet (“Data verwendet, um Vorhersagen zu machen”). In einem Anwendungsfall der Werbung, wir fügen einige data nach dem Bewertungsfenster hinzu zu reproduzieren. Arbeitsablauf Training - Inferenz wie im Abschnitt “Vorgeschlagener Ansatz” beschrieben.

Wir können diese Strategie der Kreuzvalidierung also auf die Untergruppe von data, bei der es keine Promotion gibt, mit der Vorhersagegenauigkeit (FA) als Metrik.

Mit diesem Ansatz konnten wir eine Vorhersagegenauigkeit von fast 90% mit einer Granularität auf der Ebene Familie X Tag, was eine ordentliche Leistung ist, vergleichbar mit dem, was wir bei anderen Projekten zur klassischen Vorhersage erreicht haben.

Auch wenn diese Leistung zufriedenstellend ist, hat unser Ansatz einige Einschränkungen.

Grenzwerte

Erstens, einige externe Faktoren sind nicht berücksichtigt. Zum Beispiel Medienkampagnen. Diese externen Faktoren können einen (positiven) Einfluss auf die Verkäufe haben und daher könnte überschätzt werden die Aufzug die durch die untersuchte Werbung erzeugt werden.
Zweitens, der Fall von Dauerhafte Werbeaktionen: In der Tat, es entfernt eine bedeutende Anzahl von Termine aus dem Ausbildung dataset.
Und nicht zuletzt könnte die Wirkung der Werbung insgesamt verbessert werden unter Berücksichtigung von mehrere Effekte wie zum Beispiel Kannibalisierung, Halo-Effekt, Vorgriffs-/Speichereffekte, die im letzten Abschnitt näher erläutert werden.

Weitergehen & nächste Schritte

Verbesserung der Modellierung

Um die Nettoauswirkungen einer Werbeaktion zu messen, können mehrere Effekte addiert werden:

Kannibalisierung: Die Tatsache, dass ein Produkt beworben wird und damit attraktiver ist, wirkt sich negativ auf den Verkauf eines ähnlichen Produkts aus.
Halo: Die Tatsache, dass ein Produkt beworben wird und somit attraktiver ist, wirkt sich positiv auf den Verkauf von “häufig zusammen gekauften” Produkten aus.
Vorfreude: Die Kunden kaufen vor einer Werbeaktion weniger der rabattierten Produkte, da sie wissen, dass die Preise attraktiver sein werden.
Lagerung: Die Kunden kaufen nach einer Werbeaktion weniger der rabattierten Produkte, nachdem sie während der Werbeaktion mehr Waren als üblich gekauft haben.

Die ersten beiden Effekte wurden aufgrund der gewählten Granularität (Familienebene) nicht in unsere Analyse einbezogen, und die beiden letzten waren in der Zeit, die uns für dieses Projekt zur Verfügung stand, nur schwer gründlich zu quantifizieren.

Zusammenfassend lässt sich sagen, dass die Netto-Mehrumsatz einer Promotion könnte mit diesem Wasserfall dargestellt werden:

Über die A-posteriori-Analyse hinausgehen

Wie bereits erwähnt, wird die (nachträgliche) Analyse der vergangenen Beförderungen durchgeführt (Stufe A), ist es dann möglich weitergehen von Vorhersage der Rentabilität von Zukunft Werbeaktionen (Stufe B) und schlagen schließlich eine Optimierung der Werbeplan (Stufe C).

Natürlich ist die Vorhersage (Schätzung) der zukünftigen Rentabilität einer Werbeaktion schwieriger als die Schätzung der Rentabilität einer früheren Werbeaktion, denn wir haben keine data im Rahmen der Promotion verfügbar. Die Idee ist, dass wiederverwenden die Modell entwickelt in Phase A mit data, die keine historische data ist, sondern prognostizierte data aus einem klassischen Prognosemodell, wie folgt:

Trainieren Sie zunächst das klassische Prognosemodell auf den verfügbaren data (bis heute):

Machen Sie dann die Vorhersagen mit diesem Modell (der zu prognostizierende Zeitraum muss den Bereich der zeitlichen Merkmale abdecken, der vom “Basismodell” verwendet wird):

Verwenden Sie schließlich das trainierte Basismodell mit zeitlichen Merkmalen auf der Grundlage der Prognosen des ersten Modells und schätzen Sie die Basislinie, die den Umsatzanstieg ergibt:

Natürlich ist dieser Prozess mit mehr Unsicherheiten behaftet, da die Fehler der beiden gestapelten Modelle korreliert sind.

Um den Promotionsplan zu optimieren, besteht die Strategie schließlich darin, die in der vorangegangenen Phase gemachten Erfahrungen zu nutzen, um Wählen Sie die beste Kombination von Werbeparametern um die Optimieren Sie a Geschäftsmetrik wie zum Beispiel der ROI.

Fazit

Verwendung von kontrafaktische Vorhersage zur Lösung von Geschäftsproblemen ist keine gewöhnliche Aufgabe die in der Literatur zu finden sind.

Wir haben jedoch gesehen, dass es sich um eine mächtiges Werkzeug um das Problem der Bewertung gründlich die Leistung von frühere Beförderungen, von. Vorhersage hypothetischer Verkäufe (Grundlinie), wenn es keine Beförderung gegeben hätte. Wir haben auch Empfehlungen für das Feature Engineering für ein autoregressives (Prophet) oder Gradient Boosting (XGBoost) Modell untersucht. Abschließend haben wir einige Richtlinien zur weiteren Verfeinerung der Analyse und zur Durchführung von mehr als nur einer a posteriori-Analyse beschrieben.

Vielen Dank an die anderen data-Wissenschaftler, die mit mir an diesem Projekt gearbeitet haben: Kasra & Ombeline. Dank auch an die Artefactors die diesen Artikel Korrektur gelesen haben.

Mittel Blog von Artefact.

Dieser Artikel wurde ursprünglich veröffentlicht auf Medium.com.
Folgen Sie uns auf unserem Medium Blog !

Unseren Artikel lesen

Kontaktieren Sie uns

Prognosen für etwas, das nie stattgefunden hat: Wie wir die Rentabilität vergangener Werbeaktionen geschätzt haben