Bitte entschuldigen Sie, dass ich den statistischen Jargon abgeschlachtet habe :) Ich habe hier einige Fragen zu Werbung und Klickraten gefunden. Aber keiner von ihnen hat mir sehr geholfen, meine hierarchische Situation zu verstehen.
Es gibt eine verwandte Frage. Handelt es sich bei diesen äquivalenten Darstellungen um dasselbe hierarchische Bayes'sche Modell? , aber ich bin nicht sicher, ob sie tatsächlich ein ähnliches Problem haben. Eine andere Frage Priors für hierarchisches Bayes'sches Binomialmodell geht detailliert auf Hyperpriors ein, aber ich bin nicht in der Lage, deren Lösung auf mein Problem abzubilden
Ich habe ein paar Anzeigen für ein neues Produkt online. Ich habe die Anzeigen ein paar Tage laufen lassen. Zu diesem Zeitpunkt haben genügend Personen auf die Anzeigen geklickt, um zu sehen, welche die meisten Klicks erhalten. Nachdem ich alle außer dem mit den meisten Klicks rausgeschmissen habe, lasse ich diesen noch ein paar Tage laufen, um zu sehen, wie viel Leute tatsächlich einkaufen, nachdem sie auf die Anzeige geklickt haben. Zu diesem Zeitpunkt weiß ich, ob es eine gute Idee war, die Anzeigen überhaupt zu schalten.
Meine Statistiken sind sehr laut, weil ich nicht viele Daten habe, da ich jeden Tag nur ein paar Artikel verkaufe. Aus diesem Grund ist es sehr schwer einzuschätzen, wie viele Personen nach einer Anzeige etwas kaufen. Nur etwa einer von 150 Klicks führt zu einem Kauf.
Im Allgemeinen muss ich wissen, ob ich bei jeder Anzeige so schnell wie möglich Geld verliere , indem ich die Statistiken pro Anzeigengruppe mit globalen Statistiken über alle Anzeigen vergleiche.
- Wenn ich warte, bis jede Anzeige genug Käufe gesehen hat, gehe ich pleite, weil es zu lange dauert: Testen von 10 Anzeigen Ich muss 10-mal mehr Geld ausgeben, damit die Statistiken für jede Anzeige zuverlässig genug werden. Zu diesem Zeitpunkt könnte ich Geld verloren haben.
- Wenn ich die durchschnittlichen Einkäufe aller Anzeigen beziehe, kann ich keine Anzeigen schalten, die einfach nicht so gut funktionieren.
Kann ich die globale Kaufrate ( N $ Unterverteilungen? Das bedeutet, je mehr Daten ich für jede Anzeige habe, desto unabhängiger werden die Statistiken für diese Anzeige. Wenn noch niemand auf eine Anzeige geklickt hat, gehe ich davon aus, dass der globale Durchschnitt angemessen ist.
Welche Distribution würde ich dafür wählen?
Wenn ich 20 Klicks auf A und 4 Klicks auf B hatte, wie kann ich das modellieren? Bisher habe ich herausgefunden, dass eine Binomial- oder Poisson-Verteilung hier sinnvoll sein könnte:
purchase_rate ~ poisson
(?)(purchase_rate | group A) ~ poisson
(Schätzen Sie die Kaufrate nur für die Gruppe A?)
Aber was soll ich tun , neben den tatsächlich zu berechnen purchase_rate | group A
. Wie verbinde ich zwei Distributionen, um für Gruppe A (oder eine andere Gruppe) einen Sinn zu ergeben?
Muss ich zuerst ein Modell montieren? Ich habe Daten, mit denen ich ein Modell "trainieren" kann:
- Anzeige A: 352 Klicks, 5 Käufe
- Anzeige B: 15 Klicks, 0 Käufe
- Anzeige C: 3519 Klicks, 130 Käufe
Ich suche nach einer Möglichkeit, die Wahrscheinlichkeit einer der Gruppen abzuschätzen. Wenn eine Gruppe nur ein paar Datenpunkte hat, möchte ich im Wesentlichen auf den globalen Durchschnitt zurückgreifen. Ich kenne mich ein wenig mit Bayes-Statistiken aus und habe viele PDFs von Menschen gelesen, die beschreiben, wie sie mit Bayes-Inferenz modellieren und Prioren konjugieren und so weiter. Ich denke, es gibt einen Weg, dies richtig zu machen, aber ich kann nicht herausfinden, wie man es richtig modelliert.
Über Hinweise, die mir helfen, mein Problem bayesisch zu formulieren, würde ich mich sehr freuen. Das würde mir sehr helfen, Beispiele online zu finden, mit denen ich dies tatsächlich umsetzen könnte.
Aktualisieren:
Vielen Dank für Ihre Antwort. Ich fange an, immer mehr Kleinigkeiten über mein Problem zu verstehen. Vielen Dank! Lassen Sie mich ein paar Fragen stellen, um zu sehen, ob ich das Problem jetzt ein bisschen besser verstehe:
Ich gehe also davon aus, dass die Konvertierungen als Beta-Verteilungen verteilt sind und eine Beta-Verteilung zwei Parameter hat, und b .
Die 1 Parameter sind Hyperparameter, sind sie also Parameter vor? Also habe ich am Ende die Anzahl der Conversions und die Anzahl der Klicks als Parameter für meine Beta-Distribution festgelegt?
Irgendwann, wenn ich verschiedene Anzeigen vergleichen möchte, würde ich P ( c o n v e r s i o n | a d = X ) = P ( a d = X | c o n v e r s i o berechnen n ) ∗ P ( K o n v e r s i o n ) . Wie berechne ich jeden Teil dieser Formel?
Ich denke , wird Wahrscheinlichkeit genannt, oder "Modus" der Beta - Verteilung. Das ist also α - 1 , wobeiαundβdie Parameter meiner Verteilung sind. Aber die spezifischenαundβ sindhier die Parameter für die Verteilung nur für die AnzeigeX, oder? Ist es in diesem Fall nur die Anzahl der Klicks und Conversions, die diese Anzeige erzielt hat? Oder wie viele Klicks / Conversions habenalleAnzeigen gesehen?
Dann multipliziere ich mit dem Prior, der P (Umwandlung) ist, was in meinem Fall nur der Jeffreys-Prior ist, der nicht informativ ist. Bleibt der Stand unverändert, wenn ich mehr Daten erhalte?
Ich dividiere durch , was ist die marginale Wahrscheinlichkeit, also zähle ich, wie oft auf diese Anzeige geklickt wurde?
Bei der Verwendung von Jeffreys 'Vorgänger gehe ich davon aus, dass ich bei Null beginne und nichts über meine Daten weiß. Dieser Prior wird als "nicht informativ" bezeichnet. Wenn ich weiter über meine Daten lerne, aktualisiere ich die vorherige Version?
Als Klicks und Conversions eingingen, habe ich gelesen, dass ich meine Distribution "aktualisieren" muss. Bedeutet dies, dass sich die Parameter meiner Distribution ändern oder dass sich die vorherigen ändern? Wenn ich einen Klick für Ad X erhalte, aktualisiere ich mehr als eine Distribution? Mehr als eine vor?