Ist es möglich, das pareto / nbd-Modell konzeptionell zu verstehen?


12

Ich lerne, ein BTYD-Paket zu verwenden, das das Pareto / NBD-Modell verwendet, um vorherzusagen, wann ein Kunde voraussichtlich zurück sein wird. Die gesamte Literatur zu diesem Modell ist jedoch voller Mathematik und es scheint keine einfache / konzeptionelle Erklärung für die Funktionsweise dieses Modells zu geben. Ist es möglich, das Pareto / NBD-Modell für Nicht-Mathematiker zu verstehen? Ich habe diese berühmte Zeitung von Fader durchgesehen . Das Pareto / NBD-Modell geht von folgenden Annahmen aus:

ich. Im aktiven Zustand wird die Anzahl der von einem Kunden in einem Zeitraum der Länge t getätigten Transaktionen mit der Transaktionsrate λ Poisson verteilt.

ii. Die Heterogenität der Transaktionsraten zwischen Kunden folgt einer Gammaverteilung mit dem Formparameter r und dem Skalenparameter α.

iii. Jeder Kunde hat eine unbeobachtete "Lebensdauer" der Länge τ. Dieser Punkt, an dem der Kunde inaktiv wird, wird exponentiell mit der Ausfallrate µ verteilt.

iv) Die Heterogenität der Abbrecherquoten über die Kunden folgt einer Gammaverteilung mit Formparametern und Skalenparametern β.

v. Die Transaktionsrate λ und die Abbruchrate µ variieren unabhängig voneinander zwischen Kunden. "

Ich verstehe die (Intuition dahinter) Begründung der Annahmen (ii), (iii) und (iv) nicht. Warum nur diese Distributionen, warum nicht andere?

Auch BG / NBD-Modellannahmen sind:

i.) Im aktiven Zustand folgt die Anzahl der von einem Kunden getätigten Transaktionen einem Poisson-Prozess mit der Transaktionsrate λ. Dies entspricht der Annahme, dass die Zeit zwischen Transaktionen exponentiell mit der Transaktionsrate λ verteilt ist

ii) Die Heterogenität in λ folgt einer Gammaverteilung

iii) Nach einer Transaktion wird ein Kunde mit der Wahrscheinlichkeit p inaktiv. Daher wird der Punkt, an dem der Kunde ausscheidet, nach einer (verschobenen) geometrischen Verteilung mit pmf auf die Transaktionen verteilt

iv) Die Heterogenität in p folgt einer Beta-Verteilung

Auch die (intuitive) Rationalität der Annahmen (ii), (iii) und (iv) ist keineswegs offensichtlich.

Ich werde für jede Hilfe dankbar sein. Vielen Dank.


Könnten Sie einen Verweis auf Literatur hinzufügen, die Sie schwierig finden?
kjetil b halvorsen

Ich habe ausgearbeitet, wo die Dinge unklar sind. Ich weiß, dass es nicht einfach ist, Intuition zum Spielen zu bringen, aber wenn es so möglich wäre, wäre es eine große Hilfe. Vielen Dank.
User3282777

Antworten:


13

Stellen Sie sich vor, Sie sind der neu ernannte Manager eines Blumenladens. Sie haben eine Aufzeichnung der Kunden des letzten Jahres - die Häufigkeit, mit der sie einkaufen, und wie lange seit ihrem letzten Besuch. Sie möchten wissen, wie viel Geschäft die gelisteten Kunden in diesem Jahr voraussichtlich bringen werden. Es gibt ein paar Dinge zu beachten:

[Annahme (ii)] Kunden haben unterschiedliche Einkaufsgewohnheiten.

λλ

Die Verteilung muss über wenige Parameter verfügen (Sie müssen nicht unbedingt über viele Daten verfügen), relativ flexibel sein (Sie sind vermutlich kein einfühlsamer Unternehmer und kennen sich nicht mit Einkaufsgewohnheiten aus) und einnehmen Werte in den positiven reellen Zahlen. Die Gamma-Verteilung markiert all diese Kästchen und ist gut untersucht und relativ einfach zu handhaben. Es wird häufig als Prior für positive Parameter in verschiedenen Einstellungen verwendet.

[Annahme (iii)] Möglicherweise haben Sie bereits einige der Kunden auf der Liste verloren.

Wenn Andrea im letzten Jahr etwa einmal im Monat Blumen gekauft hat, ist es ziemlich sicher, dass sie dieses Jahr wiederkommt. Wenn Ben früher wöchentlich Blumen gekauft hat, aber seit Monaten nicht mehr da ist, dann hat er vielleicht einen anderen Blumenladen gefunden. Wenn Sie zukünftige Geschäftspläne schmieden, möchten Sie vielleicht auf Andrea zählen, aber nicht auf Ben.

Die Kunden werden Ihnen nicht sagen, wann sie weitergezogen sind. Hier setzt die Annahme der „unbeaufsichtigten Lebensdauer“ für beide Modelle an. Stellen Sie sich einen dritten Kunden vor, Cary. Die Modelle Pareto / NBD und BG / NBD bieten Ihnen zwei verschiedene Möglichkeiten, sich vorzustellen, wie Cary den Laden endgültig verlässt.

Stellen Sie sich für den Fall Pareto / NBD vor, dass es zu jedem Zeitpunkt eine geringe Chance gibt, dass Cary auf einen besseren Laden stößt als Ihren. Dieses konstante infinitesimale Risiko gibt Ihnen die exponentielle Lebensdauer - und je länger es seit Carys letztem Besuch vergangen ist, desto länger ist er anderen (möglicherweise besseren) Blumengeschäften ausgesetzt.

Der BG / NBD-Fall ist etwas komplizierter. Jedes Mal, wenn Cary in Ihrem Geschäft eintrifft, hat er sich dazu verpflichtet, Blumen zu kaufen. Beim Stöbern wird er die Veränderungen in Preis, Qualität und Vielfalt seit seinem letzten Besuch berücksichtigen und sich letztendlich entscheiden, ob er das nächste Mal wiederkommt oder nach einem anderen Geschäft Ausschau hält. Anstatt ständig einem Risiko ausgesetzt zu sein, hat Cary eine gewisse Wahrscheinlichkeit, sich nach jedem Kauf zu entscheiden, das Unternehmen zu verlassen.

[Annahme (iv)] Nicht alle Kunden fühlen sich gleichermaßen zu Ihrem Geschäft verpflichtet.

Einige Kunden sind Stammkunden, und nur der Tod - oder ein starker Preisanstieg - zwingt sie zum Verlassen. Andere mögen es vielleicht erkunden und würden Sie gerne verlassen, um den neuen Hipster-Blumenladen auf der anderen Straßenseite zu besuchen. Anstelle einer einzigen Abbrecherquote für alle Kunden ist eine Verteilung der Abbrecherquoten (oder Wahrscheinlichkeiten im Fall von BG / NBD) sinnvoller.

μ(0;1)

Ich hoffe das hilft. Werfen Sie einen Blick auf das Originalpapier (Schmittlein et al., 1987), wenn Sie es noch nicht getan haben - sie gehen dort einige der Intuitionen durch.


Vielen Dank für die harte Arbeit und die klare Erklärung. Grund für die Verwendung der Gamma-Verteilung ist, dass sie relativ einfach zu verarbeiten ist und häufig als Prior für positive Parameter in verschiedenen Einstellungen verwendet wird. Die Formen der meisten Gammaverteilungen (mit unterschiedlichen Parameterwerten) sind zwar leicht zu verstehen, lassen sich aber an eine Gammaverteilung anpassen, die fast exponentiell abfällt (für k = 1, Theta = 2, wie in Wikipedia-Grafik [ hier] en.wikipedia.org/wiki/Gamma_Distribution ) ist wenig schwer zu verstehen. Schließen wir ein solches Verhalten aus?
User3282777

1
Ihre Schätzungen für die Gamma-Parameter hängen von den Daten ab, mit denen Sie arbeiten. Der springende Punkt ist, dass die Gamma-Verteilung basierend auf nur zwei Parametern signifikant unterschiedliche Formen haben kann und Sie die Daten für sich selbst sprechen lassen können, ohne übermäßig strenge Annahmen (mehr oder weniger) auferlegen zu müssen.
Lyuba B.
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.