Verstehe ich die Unterschiede zwischen Bayes'scher und frequentistischer Folgerung richtig?

7

Bei einer Folge unabhängiger Experimente, deren Ergebnis entweder Erfolg oder Misserfolg ist, liegt die Erfolgswahrscheinlichkeit bei einer Zahl p zwischen 0 und 1 :

Ein Bayesianer würde die Ergebnisse der k Experimente fest betrachten, während p zufällig wäre, dann eine vorherige Verteilung auf p annehmen und dann eine hintere Verteilung für p ergeben, wenn die Ergebnisse der k Experimente gegeben sind . Bei Verwendung einer Verteilung für p würde ein Bayesianer glaubwürdige Intervalle verwenden . $X_1, X_2, ..., X_k$

Ein Frequentist würde einen festen Wert in Betracht ziehen, aber die Ergebnisse der k Experimente $X_1, X_2, ..., X_k$ zufällig und versuchen, eine maximale Wahrscheinlichkeitsschätzung zu . Ein Frequentist würde Konfidenzintervalle verwenden .

Hypothesentest :

Ein Frequentist würde eine normale Näherung verwenden, um einen p-Wert zu erhalten, um festzustellen, ob es einen Grund gibt, eine Nullhypothese $H_0$ zugunsten einer alternativen Hypothese abzulehnen $H_1$ . Für einen Frequentisten ist $P(H_0), P(H_1) \in \{0,1\}$

Ein Bayesianer würde eine vorherige Wahrscheinlichkeit zuweisen $H_0$ und eine hintere Wahrscheinlichkeit berechnen $P(H_0 | k)$ . Ein Bayesianer würde nicht unbedingt zwischen $H_0$ und wählen $H_1$ . Vielmehr wäre ein Bayesianer eher zu geneigt, $H_0$ wenn $P(H_0 | k) > 1 - P(H_0 | k) = P(H_1 | k)$

Regression: Gegebenes Regressionsmodell $g(E(Y)) = \beta_0 + \beta_1 X_1 + ... + \beta_k X_k$

Ein Frequentist würde $\beta_i$ und andere Parameter als fest betrachten und MLE oder OLS verwenden.

Ein Bayesianer würde und andere Parameter als zufällig betrachten, ihnen vorherige Verteilungen zuweisen und dann hintere Verteilungen für und andere Parameter mit den ys und X erstellen. $\beta_i$ $\beta_i$

Stimmt etwas nicht? Was habe ich vermisst?

— BCLC
quelle

8

Diese Frage ist zu weit gefasst, aber ich dachte, ich würde auf einige Punkte antworten, an denen Ihre Aussagen nicht korrekt sind.

Bayesianer glauben (normalerweise), dass es einen festen Wert für die Parameter gibt, verwenden jedoch eine Wahrscheinlichkeitsverteilung, um ihre Unsicherheit über den wahren Wert darzustellen.
Ein Bayesianer ist in der Regel eher an der vollständigen posterioren als an einer Punkt- oder Intervallschätzung eines bestimmten Parameters interessiert (obwohl zur Vereinfachung der Berichterstattung der Ergebnisse typischerweise Punkt- oder Intervallschätzungen bereitgestellt werden).
Ein Frequentist würde in einem Binomialversuch keine normale Näherung für Hypothesentests mit einem Punkt Null verwenden.
Selbst wenn ein Frequentist "eine Nullhypothese ablehnt", heißt das nicht, dass er die Alternative wählt.
Bayesianer werden zwischen Hypothesen wählen, wenn sie dazu gezwungen werden, aber normalerweise würden wir die Modellmittelung bevorzugen.
In einem Regressionsproblem verwenden viele Frequentisten Methoden der bestraften Wahrscheinlichkeit, z. B. Lasso, Gratregression, elastisches Netz usw., und würden daher die MLE- oder OLS-Schätzer nicht verwenden.

— jaradniemi
quelle

1

Ein Bayesianer würde die Ergebnisse der Experimente als fix betrachten und Populationsparameter als Stochasten betrachten. Dies im Gegensatz zu Frequentisten, die die Daten als "nur eine weitere Stichprobe in einem endlosen Strom von Stichproben" betrachten und die Populationsparameter als fest (aber unbekannt) betrachten.

Die logische Bayes'sche Reihenfolge wäre: 1. Definieren Sie die vorherige Verteilung 2. Sammeln Sie Daten 3. Verwenden Sie diese Daten, um Ihre vorherige Verteilung zu aktualisieren. Nach dem Update wird es als posteriore Verteilung bezeichnet.

Wohlgemerkt, ein Konfidenzintervall unterscheidet sich wirklich von einem glaubwürdigen Intervall. Ein Konfidenzintervall bezieht sich auf das Stichprobenverfahren. Wenn Sie viele Stichproben entnehmen und für jede Stichprobe ein 95% -Konfidenzintervall berechnen würden, würden Sie feststellen, dass 95% dieser Intervalle den Populationsmittelwert enthalten.

Dies ist beispielsweise für Abteilungen für industrielle Qualität nützlich. Diese Leute nehmen viele Proben und haben jetzt das Vertrauen, dass die meisten ihrer Schätzungen der Realität ziemlich nahe kommen werden. Sie wissen, dass 95% ihrer Schätzungen nahe beieinander liegen, aber sie können das nicht über eine bestimmte Schätzung sagen.

Vergleichen Sie dies mit dem Würfeln: Wenn Sie 600 (faire) Würfel werfen, ist Ihre beste Vermutung, dass 1/6, dh 100 Würfel, eine Sechs würfeln. Aber wenn jemand 1 Würfel gewürfelt hat und Sie fragt: "Wie hoch ist die Wahrscheinlichkeit, dass dieser Wurf eine 6 war?", - ist die Antwort "Nun, das sind 1/6 oder 16,6%" falsch . Der Würfel zeigt entweder eine 6 oder eine andere Figur. Die Wahrscheinlichkeit ist also 1 oder 0.

Auf die Frage vor dem Wurf, wie hoch die Wahrscheinlichkeit ist, eine 6 zu werfen, würde ein Bayesianer "1/6" sagen (basierend auf vorherigen Informationen: Jeder weiß, dass ein Würfel 6 Seiten hat), aber ein Frequestist würde "Keine Ahnung" sagen, weil er häufig ist basiert ausschließlich auf den Daten, nicht auf Prioritäten.

Wenn Sie nur 1 Stichprobe (also 1 Konfidenzintervall) haben, können Sie ebenfalls nicht sagen, wie wahrscheinlich es ist, dass der Populationsmittelwert in diesem Intervall liegt. Es ist entweder drin oder nicht. Die Wahrscheinlichkeit ist entweder 1 oder 0.

Wenn ein Frequentist H0 ablehnt, bedeutet dies, dass P (Daten | H0) kleiner als ein Schwellenwert ist. Er sagt: "Es ist sehr unwahrscheinlich, dass diese Art von Daten gefunden wird, wenn H0 wahr ist. Daher gehe ich davon aus, dass H0 nicht wahr ist, daher muss H1 wahr sein." Daher müssen sich H0 und H1 in diesem Rahmen gegenseitig ausschließen und alle Möglichkeiten abdecken.

Soweit ich weiß, sagen einige Frequentisten, dass wenn H0 abgelehnt wird, dies nicht bedeutet, dass H1 offiziell akzeptiert wird; andere sagen, dass das Ablehnen des einen gleichbedeutend ist mit dem Akzeptieren des anderen.

Das Testen von Hypothesen nach einer Bayes'schen Methode unterscheidet sich geringfügig. Die Methode besteht darin, zu sehen, wie gut die Daten durch Hypothese A, B oder C vorhergesagt werden (dies muss nicht auf zwei Hypothesen beschränkt werden). Der Forscher könnte sagen: "Hypothese A erklärt die Daten 3 x besser als Hypothese B und 50 Mal besser als Hypothese C".

— Pieter Hogendoorn
quelle