Leitfaden zur Attribution 2.0 – Analytisch die Marketingstrategie optimieren

In einem vorangegangenen Blogbeitrag zum Thema „Leitfaden zur Attribution“ haben wir einige Standardmodelle der Channel Attribution vorgestellt. In diesem Beitrag möchten wir zeigen, wie durch Analysen die Marketingstrategie optimiert werden kann und werden dafür die datengetriebene Attribution einmal näher betrachten. Bei der Data Driven Attribution (DDA) geht es in erster Linie um die Analyse der Daten, die während einer Session über ihre User gesammelt werden. Die gesammelten Daten müssen dabei wiederum für die datengetriebene Attribution geeignet sein. Daher ist es unabdingbar, im Vorhinein die Richtigkeit und Sauberkeit der Daten zu überprüfen. Ist diese Vorarbeit geleistet, kann mit der DDA begonnen werden. Auch in diesem Beitrag möchten wir die hierzu verwendeten Modelle anhand eines Fußball-Beispiels einführen. Hierbei stellen die einzelnen Spieler die verschiedenen Kanäle, eine Passabfolge die Customer Journey und ein Tor die Conversion dar.

Diesmal sollen die TV-Experten das letzte Champions League Finalspiel analysieren, welches 3:2 ausging. Wieder steht die Siegermannschaft im Vordergrund. Es geht vor allem um die vier Spieler, die an den drei Toren beteiligt waren. Welchen Anteil hatten die einzelnen Spieler an den Toren? In der letzten Diskussionsrunde vertraten die Experten verschiedene Meinungen, konnten diese begründen, jedoch nicht belegen. Nun möchte der Moderator, dass die Standpunkte auch entsprechend belegt werden.

Datengetriebene Attribution

Shapley Value

Eine Herangehensweise, bei der man versucht, die Tore auf die einzelnen Spieler zu verteilen, ist der sogenannte „Shapley Value“. Um den konkreten Wert-Anteil an den Toren eines Spielers ermitteln zu können, berechnen wir, inwiefern sich die die Tore verändern würden, wenn ein Spieler zu einem Team von anderen Spielern hinzugefügt werden würde. Zu diesem Zweck ermitteln wir zunächst die Anzahl der Möglichkeiten, vier Spieler auf vier Plätze zu verteilen.

Daraus ergeben sich in unserem Beispiel genau 24 Fälle. Möchten wir nun den Wert von E-Mail ermitteln, betrachten wir eine Menge an Spielern ohne E-Mail und die Anzahl der Tore x, die diese Gruppe schießt. Anschließend fügen wir den Spieler E-Mail zu dieser Gruppe hinzu und berechnen wie viele Tore y mit E-Mail geschossen werden. Die Differenz z = y-x entspricht dem Mehrwert des Spielers E-Mail in dieser Gruppenkonstellation.

Wir verzichten in unserem Beispiel auf die Reihenfolge der Spieler, d.h. die Gruppe [S, P, D] schießt genau wie die Gruppe [S, D, P] ein Tor. Fügt man beiden Gruppen den Spieler E-Mail hinzu, so schießt die erweiterte Gruppe drei Tore und wir erhalten in beiden Fällen einen Mehrwert von zwei Toren. Geht man nun alle Fälle durch, addiert die jeweiligen Mehrwerte auf und dividiert diesen Wert mit der Gesamtanzahl an Fällen, ergibt sich der Anteil des Spielers E-Mail an den drei geschossenen Toren. Somit kommt E-Mail auf insgesamt 0,58 geschossene Tore.

Markov-Ketten

Die Markov-Ketten betrachten den Fall, dass ein Spieler aus der gesamten Gruppe entfernt wird. Dies wird auch „Removal Effect“ genannt. In anderen Worten: Man berechnet den Verlust an Toren, der entsteht, wenn ein Spieler ausfällt. Im ersten Schritt betrachten wir die sogenannten „Channeleinstiege“, sprich das Einleiten der Tore. Anschließend berechnen wir die Wahrscheinlichkeiten aller Pässe und Tore.

Der Einfachheit halber betrachten wir nur die tatsächlichen Pässe und Tore. Um den Anteil des Spielers E-Mail an den drei Toren zu berechnen, werden wir ihn aus dem Spiel nehmen.

Die Anzahl der Tore fällt von eins (drei Tore wurden geschossen) auf 0,33 (die beiden Spieler Direct und Paid Search schießen nur ein Tor). Wir verzeichnen somit einen Verlust von 0,67, sprich es werden zwei Tore weniger geschossen. Der Anteil von E-Mail an den drei Toren kann nun wie folgt berechnet werden: Anzahl aller geschossener Tore multipliziert mit dem Verlust von E-Mail dividiert durch die Summe der Verluste der einzelnen Spieler.

Wendet man die Markov-Ketten an, bekommt E-Mail einen Anteil von 0,74 Toren an den insgesamt drei geschossenen Toren.

Abbildung 1 - Die drei Tore der Siegermannschaft

Abbildung 2 - Anzahl der möglichen Fälle

Leitfaden zur Attribution_Shapley_Aufteilung

Abbildung 3 - Aufteilung der Tore auf die Spieler mittels Shapley Value

Abbildung 4 - Vereinfachter Graph nach Herausnahme von E-Mail

Leitfaden zur Attribution_Markov_Aufteilung

Abbildung 5 - Aufteilung der Tore mittels Markov-Ketten

Fazit zur Data Driven Attribution

An dieser Stelle sollte erwähnt werden, dass grundsätzlich auch mit Hilfe von Linearer Regression DDA betrieben werden kann, wir jedoch nicht näher drauf eingehen, da die Lineare Regression ein Standardwerkzeug jedes Analysten ist. Wir haben gesehen, dass bei der datengetriebenen Attribution viel Vorarbeit geleistet werden muss. Ein weiterer Nachteil ist, dass die oben eingeführten Verfahren sehr schnell komplex werden können. Zum Beispiel würden wir beim Shapley Value auf rund 720 zu betrachtende Fälle kommen, wenn wir sieben Spieler berücksichtigen. Das hat zur Folge, dass solche Verfahren sehr zeit- und rechenintensiv sind. Neben der benötigten Expertise, um solche Verfahren fehlerfrei und korrekt anwenden zu können, wird somit auch viel Kapazität benötigt. Sollen zusätzlich Offline Channel berücksichtigt werden, sind diese beiden Verfahren praktisch nicht mehr anwendbar.

Daher empfehlen wir zunächst die Standardmodelle anzuwenden. Hierdurch lernt man seine Kunden kennen, kann die Customer Journey nachvollziehen und hat bereits einen groben Überblick, wie die einzelnen Kanäle „performen“ könnten. Reicht dies nicht aus und kommt man mit den Standardmodellen an sein Limit, empfehlen wir zur DDA überzugehen, um eine objektive Betrachtungsweise heranzuziehen und Interessenskonflikte innerhalb des Unternehmens zu vermeiden. Beide vorgestellten Modelle sind relativ leicht implementierbar und können sehr gut interpretiert werden. Dabei kann sogar die Reihenfolge der besuchten Kanäle in der Customer Journey berücksichtigt werden. Ein weiterer Vorteil ist, dass die tatsächliche Menge an Conversions neu auf die Kanäle verteilt wird. Die Markov-Ketten bieten zusätzlich die Möglichkeit zur Visualisierung der Channel-Wechselwirkungen anhand übersichtlicher Graphen. Entscheidet man sich für die Lineare Regression, so können neben dem Channel-Traffic auch alle anderen Daten in das Modell integriert werden, wodurch Einflüsse einzelner Merkmale gut herausgestellt werden können. Die Resultate können anhand der Daten statistisch belegt werden, die im optimalen Fall nicht nur eine Beschreibung des Beobachtungszeitraums, sondern auch konkrete Empfehlungen und Vorhersagen liefern.

Lest auch unseren spannenden OMKB „Data Deep Dive“ Gastbeitrag zu dem Thema!

Findest Du dieses Thema spannend oder hast Du weitere Fragen zu dem Thema „Data Driven Attribution“ bzw. zu den „Attributionsmodellen“? Dann melde Dich gerne direkt bei uns.