Gleich oder anders? Der Bayes'sche Weg

Angenommen, ich habe das folgende Modell:

Poisson (λ) \sim {\begin{cases} λ_{1} & if t < τ \\ λ_{2} & if t \geq τ \end{cases}

$\text{Poisson}(\lambda) \sim \begin{cases} \lambda_1 & \text{if } t \lt \tau \\ \lambda_2 & \text{if } t \geq \tau \end{cases}$

Und ich schließe die unten gezeigten Posterioren für und aus meinen Daten ab. Gibt es einen Bayes - Weg (oder Quantifizierung) , wenn zu sagen und das sind gleich oder verschieden ? $\lambda_1$ $\lambda_2$ $\lambda_1$ $\lambda_2$

Vielleicht die Wahrscheinlichkeit $\lambda_1$ $\lambda_2$ messen, dass sich von ? Oder vielleicht KL-Divergenzen verwenden?

Wie kann ich beispielsweise oder zumindest messen ? $p(\lambda_2 \neq \lambda_1)$ $p(\lambda_2 \gt \lambda_1)$

Was ist im Allgemeinen eine gute Möglichkeit, diese Frage zu beantworten , wenn Sie die unten gezeigten Posterioren haben ( für beide überall PDF-Werte ungleich Null annehmen )?

Geben Sie hier die Bildbeschreibung ein

Aktualisieren

Es scheint, dass diese Frage auf zwei Arten beantwortet werden kann:

Wenn wir Proben der Posterioren haben, könnten wir uns den Bruchteil der Proben ansehen, bei denen (oder gleichwertig ). @ Cam.Davidson.Pilon enthielt eine Antwort, die dieses Problem mithilfe solcher Beispiele beheben würde. $\lambda_1 \neq \lambda_2$ $\lambda_2 > \lambda_1$
Integration eines Unterschieds der Posterioren. Und das ist ein wichtiger Teil meiner Frage. Wie würde diese Integration aussehen? Vermutlich würde sich der Stichprobenansatz diesem Integral annähern, aber ich würde gerne die Formulierung dieses Integrals kennen.

Hinweis: Die obigen Darstellungen stammen aus diesem Material .

distributions bayesian poisson-distribution

— Amelio Vazquez-Reina
quelle

Sie können einfach die Varianz beider Verteilungen berechnen und hinzufügen. Das ist die Varianz des Unterschieds in den Mitteln. Berechnen Sie dann die Differenz der Mittelwerte und sehen Sie, wie viele Standardabweichungen es sind. Sie können beide Verteilungen mit Normal approximieren, um zu beginnen, und die üblichen Konfidenzintervalle für eine Normalverteilung verwenden. Sie sind eindeutig unterschiedliche Mittel.

— Dave31415

Intrinsische Hypothesentests sind eine Antwort

— Stéphane Laurent

Alle erforderlichen Berechnungen sind in meiner Arbeit enthalten, aber ich habe den Fall von nicht untersucht ( ist das Verhältnis der beiden Poisson-Raten)

H_{0} : {ϕ = 1}

$H_0:\{\phi=1\}$

ϕ

$\phi$

— Stéphane Laurent

Danke @ StéphaneLaurent. Ihr Papier ist ein guter Hinweis, aber es scheint spezifisch für Poisson-Prozesse zu sein. Was ist der Vergleich auf hoher Ebene, den ein Bayesianer durchführen kann, um abzuschätzen, ob gleich oder verschieden von ? Muss die Analyse verteilungsspezifisch sein?

λ_{2}

$\lambda_2$

λ_{1}

$\lambda_1$

— Amelio Vazquez-Reina

Sorry @ user023472 Ich habe heutzutage keine Energie. Siehe Bernardos Papiere, die in meinem Papier zitiert sind. "Eigen" bedeutet, dass die Methode vom und nur vom Modell abgeleitet wird.

— Stéphane Laurent

Antworten:

Ich denke, eine bessere Frage ist, sind sie signifikant unterschiedlich?

Um dies zu beantworten, müssen wir berechnen . Nennen Sie diese Menge . Wenn , besteht die gleiche Chance, dass einer größer als der andere ist. Wenn andererseits wirklich nahe bei 1 liegt, können wir sicher sein, dass yes größer (sprich: anders) als . $P(\lambda_2 > \lambda_1)$ $p$ $p \approx 0.50$ $p$ $\lambda_2$ $\lambda_1$

Wie berechnen wir ? In einem Bayesian MCMC-Framework ist dies trivial. Wir haben Samples aus dem posterioren Bereich. Berechnen wir also einfach die Wahrscheinlichkeit, dass Samples aus größer als : $p$ $\lambda_2$ $\lambda_1$

 p = np.mean( lambda_2_samples > lambda_1_samples )
 print p

Ich entschuldige mich dafür, dass ich dies nicht in das Buch aufgenommen habe. Ich werde es definitiv hinzufügen, da ich denke, dass es eine der nützlichsten Ideen in der Bayes'schen Folgerung ist

— Cam.Davidson.Pilon
quelle

Die Wahrscheinlichkeit ist 1,0, sie sind unterschiedlich, da beide kontinuierliche Zufallsvariablen sind. Bedenken Sie: Was ist Ihre vorherige Vermutung, dass ? Glaubst du wirklich, dass sie tatsächlich gleich sind? (Ignorieren Sie das Testen von Hypothesen: Wir leben in der realen Welt, in der Variablen niemals gleich sind.) Siehe diesen Beitrag von meinem Helden Gelman. Computergestützt können Sie dies durch Rechnen testen .

λ_{1} = λ_{2}

$\lambda_1 = \lambda_2$ np.mean( lambda_2_samples != lambda_1_samples)

— Cam.Davidson.Pilon

Sie können definieren, wie wichtig "ungleich" ist. Wenn in Ihrem Beispiel beispielsweise ein Unterschied von weniger als eins praktisch nicht aussagekräftig ist, können Sie sich ansehen, und dies würde Ihnen eine aussagekräftige Statistik für

P (| λ_{1} - λ_{2} | > 1)

$P(|\lambda_1-\lambda_2| > 1)$

P (λ_{1} \neq λ_{2})

$P(\lambda_1 \ne \lambda_2)$

— Sam Dickson

Um meinen vorherigen Kommentar zu ergänzen: Wenn die Variablen und diskret waren, besteht die Möglichkeit, dass = .

λ_{1}

$\lambda_1$

λ_{2}

$\lambda_2$

λ_{2}

$\lambda_2$

λ_{1}

$\lambda_1$

— Cam.Davidson.Pilon

Oh Gott, ich würde es hassen, in dieser Situation zu sein! Es geht um böse Integrale. Bei den meisten Modellen können Sie die Posterioren nicht ableiten. Selbst wenn Sie könnten, könnte es immer noch besser sein, einen Computer zu verwenden, nur um Proben zu erhalten. Zusammenfassend Beispiele> Formeln für Berechnungen wie diese.

— Cam.Davidson.Pilon

Sie messen nicht "ausreichend größer". Betrachten Sie eine Verteilung mit einem Peak bei Null und eine andere mit gleichen Massen bei Peaks -10, 10. Ihre Statistik - der erwartete Wert des Indikators, dass eine Probe größer als die andere ist - ergibt 0,5, aber die Verteilungen sind eindeutig völlig unterschiedlich.

— Neil G

Wie bereits erwähnt, ist diese Frage trivial. Angenommen, und sind kontinuierliche Zufallsvariablen, . $\lambda_1$ $\lambda_2$ $\Pr(\lambda_1=\lambda_2)=0$

Ich vermute, Sie interessieren sich für die Wahrscheinlichkeit, dass und innerhalb eines voneinander liegen. In diesem Fall ist der Bereich der Differenz der beiden hinteren Dichten im Intervall Ihre Antwort. Größere Überlappungswerte zeigen an, dass die beiden Seitenzähne ähnlicher sind. $\lambda_1$ $\lambda_2$ $\epsilon$ $[-\epsilon/2, \epsilon/2]$

Wenn Sie lieber mit simulierten Ergebnissen arbeiten möchten (und für die meisten Probleme haben wir nicht den Luxus der Wahl), nehmen Sie einfach den Anteil der Ergebnisse, wobei als Annäherung. $\lambda_2>\lambda_1$

— Sycorax sagt Reinstate Monica
quelle

Vielen Dank. In welcher Beziehung steht Ihre Antwort zu einigen der Ideen, die in den Kommentaren des OP erörtert wurden?

— Amelio Vazquez-Reina

Entschuldigung, aber ich bin mit keiner dieser Methoden vertraut, daher kann ich keinen aussagekräftigen Kommentar abgeben. @ Stéphane_Laurent ist allerdings ziemlich schlau, daher würde ich empfehlen, zumindest den Link durchzusehen.

— Sycorax sagt Reinstate Monica

@ user023472 Entschuldigung, ich habe heute nicht die Energie, eine Antwort auf den Ansatz der intrinsischen Diskrepanz zu geben. Es basiert auf der Kullback-Leibler-Divergenz.

— Stéphane Laurent

@ user777 Dies erfordert das Reparieren von . Was ist, wenn ich nur die Wahrscheinlichkeit oder sehen möchte ?

ϵ

$\epsilon$

p (λ_{2} > λ_{1})

$p(\lambda_2 \gt \lambda_1)$

p (λ_{2} \neq λ_{1})

$p(\lambda_2 \neq \lambda_1)$

— Amelio Vazquez-Reina

Danke @ user777. Ich interessiere mich für den Fall, dass wir keinen Zugang zu den Proben haben. Sie hatten früher ein Integral in Ihrem Beitrag, aber Sie scheinen es gelöscht zu haben. Wie würde dieses Integral aussehen?

— Amelio Vazquez-Reina