Beispiele für bayesianische und frequentistische Ansätze geben unterschiedliche Antworten

54

Hinweis: Ich bin bewusst , philosophischen Unterschiede zwischen Bayes und frequentistischen Statistiken.

Zum Beispiel: "Wie groß ist die Wahrscheinlichkeit, dass die Münze auf dem Tisch Kopf ist?" Ist in der Frequenzstatistik nicht sinnvoll, da entweder Kopf oder Zahl bereits gelandet sind - es gibt keine Wahrscheinlichkeit dafür. Die Frage ist also häufig unbeantwortet.

Aber ein solcher Unterschied ist nicht die Art von Unterschied, nach der ich frage.

Vielmehr würde ich gerne wissen, wie sie ihre Prognosen für wohlgeformte Fragen tatsächlich unterscheiden sich in der realen Welt, ohne jegliche theoretischen / philosophische Unterschiede wie das Beispiel , das ich oben erwähnt.

Also mit anderen Worten:

Was ist ein Beispiel für eine Frage, die sowohl in der frequentistischen als auch in der bayesianischen Statistik beantwortet werden kann und deren Antwort sich zwischen den beiden unterscheidet?

(ZB antwortet einer von ihnen auf eine bestimmte Frage mit "1/2" und der andere mit "2/3".)

Gibt es solche Unterschiede?

Wenn ja, welche Beispiele gibt es?
Wenn nicht, wann macht es dann überhaupt einen Unterschied, ob ich bei der Lösung eines bestimmten Problems Bayes'sche oder frequentistische Statistiken verwende?
Warum sollte ich eins für das andere vermeiden?

bayesian frequentist

— Mehrdad
quelle

8

John Kruschke hat gerade zwei Videos produziert, in denen er Bayes'sche und statistische Standardmethoden vergleicht. Er hat viele Beispiele, in denen die Bayes'sche Methode ablehnt, die Standardmethode jedoch nicht. Vielleicht nicht genau das, wonach Sie gesucht haben, aber trotzdem ... youtu.be/YyohWpjl6KU und youtu.be/IhlSD-lIQ_Y .

— Rasmus Bååth,

4

Die Binomialverteilung ist ein weiteres Beispiel, bei dem sich die frequentistische (auf der Wahrscheinlichkeit beruhende) Inferenz und die Bayes'sche Inferenz in einigen Fällen unterscheiden. Die Profilwahrscheinlichkeit des Parameters

fällt bei einigen Stichproben nicht auf

da

( siehe ). Dies impliziert, dass einige Wahrscheinlichkeits-Konfidenzintervalle unendlich lang sind. Andererseits fällt die marginale hintere Verteilung von

immer als

as auf

ab,

, dass sie integrierbar ist.

N

$N$

0

$0$

N \to \infty

$N\rightarrow \infty$

N

$N$

0

$0$

N \to \infty

$N\rightarrow\infty$

@Procrastinator: Danke, ich schaue mir gerade die erwähnten Folien an. Dies scheint ein bisschen intensiver zu sein als mein mathematischer Hintergrund, aber ich hoffe, ich werde etwas daraus machen. :)

— Mehrdad

2

Vielleicht möchten Sie sich Stones Beispiel ansehen. Ich erkläre es auf meinem Blog hier: normaldeviate.wordpress.com/2012/12/08/…

— Larry Wasserman

1

@mbq: Ich frage mich nur, warum wurde dieses Community-Wiki erstellt?

— Mehrdad

9

Dieses Beispiel stammt von hier . (Ich glaube sogar, ich habe diesen Link von SO erhalten, kann ihn aber nicht mehr finden.)

$n=14$ $k=10$ $\theta$ $\theta$

f (y_{f, 1} = heads, y_{f, 2} = heads | θ) = f (y_{f, 1} = heads) f (y_{f, 2} = heads | θ) = θ^{2} .

$f(y_{f,1}=\text{heads},y_{f,2}=\text{heads}|\theta)=f(y_{f,1}=\text{heads})f(y_{f,2}=\text{heads}|\theta)=\theta^2.$

Beta (α_{0}, β_{0})

$\text{Beta}(\alpha_0,\beta_0)$

\begin{array}{rcl} f (y_{f, 1} = heads, y_{f, 2} = heads | y) & = & \int f (y_{f, 1} = heads, y_{f, 2} = heads | θ) π (θ | y) d θ \\ = & \frac{Γ (α_{0} + β_{0} + n)}{Γ (α_{0} + k) Γ (β_{0} + n - k)} \int θ^{2} θ^{α_{0} + k - 1} {(1 - θ)}^{β_{0} + n - k - 1} d θ \\ = & \frac{Γ (α_{0} + β_{0} + n)}{Γ (α_{0} + k) Γ (β_{0} + n - k)} \frac{Γ (α_{0} + k + 2) Γ (β_{0} + n - k)}{Γ (α_{0} + β_{0} + n + 2)} \\ = & \frac{(α_{0} + k) \cdot (α_{0} + k + 1)}{(α_{0} + β_{0} + n) \cdot (α_{0} + β_{0} + n + 1)} \end{array}

$\begin{eqnarray*} f(y_{f,1}=\text{heads},y_{f,2}=\text{heads}|y)&=&\int f(y_{f,1}=\text{heads},y_{f,2}=\text{heads}|\theta)\pi(\theta|y)d\theta\notag\\ &=&\frac{\Gamma\left(\alpha _{0}+\beta_{0}+n\right)}{\Gamma\left(\alpha_{0}+k\right)\Gamma\left(\beta_{0}+n-k\right)}\int \theta^2\theta ^{\alpha _{0}+k-1}\left( 1-\theta \right) ^{\beta _{0}+n-k-1}d\theta\notag\\ &=&\frac{\Gamma\left(\alpha_{0}+\beta_{0}+n\right)}{\Gamma\left(\alpha_{0}+k\right)\Gamma\left(\beta_{0}+n-k\right)}\frac{\Gamma\left(\alpha_{0}+k+2\right)\Gamma\left(\beta_{0}+n-k\right)}{\Gamma\left(\alpha_{0}+\beta_{0}+n+2\right)}\notag\\ &=&\frac{(\alpha_{0}+k)\cdot(\alpha_{0}+k+1)}{(\alpha_{0}+\beta_{0}+n)\cdot(\alpha_{0}+\beta_{0}+n+1)} \end{eqnarray*}$

Beta (1, 1)

$\text{Beta}(1, 1)$

(10 / 14)^{2} \approx .51

$(10/14)^2\approx.51$

— Christoph Hanck
quelle

+1 genau die Art von Antwort, die ich gesucht habe, danke.

— Mehrdad

5

Es gab tatsächlich ein Update für den Beitrag, auf den in der Antwort verwiesen wird ... Obwohl er den Beitrag verlassen hat, "können wir, anstatt die einheitliche Verteilung wie zuvor zu verwenden, noch agnostischer sein. In diesem Fall können wir die Beta-Version verwenden ( 0,0) Verteilung nach dem Stand der Technik. Eine solche Verteilung entspricht dem Fall, in dem jeder Mittelwert der Verteilung gleich wahrscheinlich ist. In diesem Fall liefern die beiden Ansätze Bayesian und Frequentist die gleichen Ergebnisse. " !!! Wir brauchen also noch ein Beispiel, um diese Frage zu beantworten! Daher +1 auf die Antwort unten als die wahre Antwort auf diese Frage.

— user1745038

10

Siehe meine Frage hier , in der ein Artikel von Edwin Jaynes erwähnt wird, der ein Beispiel für ein korrekt konstruiertes Häufigkeitsintervall gibt, in dem die Stichprobe genügend Informationen enthält, um sicher zu sein, dass der wahre Wert der Statistik nirgendwo im Vertrauensintervall liegt ( und somit unterscheidet sich das Konfidenzintervall vom Bayes'schen glaubwürdigen Intervall.

Der Grund dafür ist jedoch die unterschiedliche Definition eines Konfidenzintervalls und eines glaubwürdigen Intervalls, was wiederum eine direkte Folge der unterschiedlichen Definitionen der Wahrscheinlichkeit nach Frequentist und Bayes ist. Wenn Sie einen Bayesianer bitten, ein Bayesianisches Konfidenzintervall (anstatt eines glaubwürdigen) zu erstellen, dann vermute ich, dass es immer ein Prior gibt, für das die Intervalle gleich sind, daher sind die Unterschiede auf die Wahl des Prior zurückzuführen.

Ob häufig verwendete oder bayesianische Methoden geeignet sind, hängt von der Frage ab, die Sie stellen möchten, und letztendlich entscheidet der Unterschied in der Philosophie über die Antwort (vorausgesetzt, der erforderliche Rechenaufwand und der Analyseaufwand spielen keine Rolle).

Man könnte argumentieren, dass eine Langzeithäufigkeit eine durchaus vernünftige Methode ist, um die relative Plausibilität eines Satzes zu bestimmen. In diesem Fall ist die frequentistische Statistik eine etwas merkwürdige Teilmenge des subjektiven Bayesianismus - also jede Frage, die ein Frequentist beantworten kann Ein subjektivistischer Bayesianer kann auch auf die gleiche Art und Weise antworten oder auf eine andere Art und Weise, falls er andere Prioritäten wählt. ;O)

— Dikran Beuteltier
quelle

4

Der Gebrauch von "subjektivem Bayesian" ist ein bisschen eine Selbstsabotage ( siehe ). Die Modellierung ist im Allgemeinen voller Subjektivismus, die Wahl einer Verteilung für die Modellierung einer Stichprobe ist auch subjektiv. Auch die Auswahl eines Anpassungstests zur Überprüfung, ob ein bestimmtes Modell angemessen ist, ist subjektiv.

2

Ich stimme dem nicht wirklich zu, wenn jemand "subjektiv" als perjorativ ansieht, ist das sein Fehler. Wenn wir Wahrscheinlichkeit meinen, meinen wir manchmal wirklich subjektiven persönlichen Glauben - ich sehe keinen Grund, es nicht so zu nennen, wenn es das ist, was tatsächlich gemeint ist (nur langfristige Frequenzen zu akzeptieren, da die Definition von Wahrscheinlichkeit eine rein subjektive Wahl ist).

— Dikran Beuteltier

1

+1 Danke für den Link, es ist sehr aufschlussreich. Und auch für den Hinweis auf den Unterschied zwischen Vertrauen und glaubwürdigen Intervallen.

— Mehrdad

8

Ich bin der Meinung, dass dieses Papier einen besseren Einblick in die Kompromisse zwischen den beiden Anwendungen bietet. Ein Teil davon könnte auf meine Vorliebe für Intervalle anstatt für Tests zurückzuführen sein.

Gustafson, P. und Greenland, S. (2009). Intervallschätzung für unordentliche Beobachtungsdaten . Statistical Science 24: 328–342.

In Bezug auf Intervalle kann es sinnvoll sein, zu berücksichtigen, dass häufig auftretende Konfidenzintervalle eine einheitliche Erfassung erfordern (genau oder mindestens größer als x% für jeden Parameterwert, der keine Nullwahrscheinlichkeit aufweist), und wenn nicht haben das - sie sind nicht wirklich Konfidenzintervalle. (Einige gehen noch weiter und sagen, dass sie auch relevante Teilmengen ausschließen müssen, die die Abdeckung verändern.)

Die Bayes'sche Berichterstattung wird normalerweise dadurch definiert, dass die "durchschnittliche Berichterstattung" verringert wird, wenn angenommen wird, dass die vorherige Berichterstattung genau korrekt ist. Gustafson und Greenland (2009) bezeichnen diese allmächtigen Prioritäten als fehlbar, um eine bessere Einschätzung zu ermöglichen.

— Phaneron
quelle

1

+1 Ich wusste nie über diesen Unterschied in der Einschränkung, danke, dass Sie darauf hingewiesen haben.

— Mehrdad

3

Wenn jemand eine Frage stellen würde, die sowohl eine häufig gestellte als auch eine bayesianische Antwort hat, könnte meiner Meinung nach eine andere Person eine Mehrdeutigkeit in der Frage erkennen und sie daher nicht "gut geformt" machen.

Mit anderen Worten, wenn Sie eine häufig auftretende Antwort benötigen, wenden Sie häufig auftretende Methoden an. Wenn Sie eine Bayes'sche Antwort benötigen, wenden Sie die Bayes'schen Methoden an. Wenn Sie nicht wissen, welche Sie benötigen, haben Sie die Frage möglicherweise nicht eindeutig definiert.

In der realen Welt gibt es jedoch oft verschiedene Möglichkeiten, ein Problem zu definieren oder eine Frage zu stellen. Manchmal ist nicht klar, welcher dieser Wege vorzuziehen ist. Dies ist besonders dann der Fall, wenn der Kunde statistisch naiv ist. Manchmal ist eine Frage viel schwieriger zu beantworten als eine andere. In solchen Fällen versucht man oft am einfachsten sicherzustellen, dass seine Kunden genau mit der Frage einverstanden sind, die er stellt oder die er löst.

— Emil Friedman
quelle

3

Ich empfehle, Übung 3.15 des frei verfügbaren Lehrbuchs Informationstheorie, Inferenz und Lernalgorithmen von MacKay zu lesen.

Beim 250-fachen Umdrehen kam eine belgische Ein-Euro-Münze 140-mal auf den Kopf und 110-mal. "Für mich sieht das sehr verdächtig aus", sagte Barry Blight, Dozent für Statistik an der London School of Economics. "Wenn die Münze unvoreingenommen wäre, wäre die Chance, ein so extremes Ergebnis zu erzielen, weniger als 7%." Aber geben diese Daten Hinweise darauf, dass die Münze eher voreingenommen als fair ist?

$p$ $0.07$ $6:1$

— Flunder
quelle