Warum impliziert ein 95% Konfidenzintervall (CI) keine 95% ige Chance, den Mittelwert zu enthalten?


228

Es scheint, dass aufgrund verschiedener verwandter Fragen hier Konsens besteht, dass der "95%" -Teil des von uns als "95% -Konfidenzintervall" bezeichneten Teils darauf verweist, dass wir unsere Stichproben- und CI-Berechnungsverfahren viele Male exakt replizieren müssten 95% der so berechneten CIs würden den Populationsmittelwert enthalten. Es scheint auch der Konsens zu sein, dass diese Definition nicht stimmtLassen Sie aus einem einzigen 95% -KI den Schluss zu, dass die Wahrscheinlichkeit, dass der Mittelwert irgendwo im KI liegt, bei 95% liegt. Ich verstehe jedoch nicht, wie Ersteres Letzteres nicht impliziert, da, nachdem ich mir viele CIs vorgestellt habe, von denen 95% die Bevölkerung enthalten, dies nicht unsere Unsicherheit sein sollte (im Hinblick darauf, ob unser tatsächlich berechnetes CI die Bevölkerung enthält) bedeuten oder nicht) uns zwingen, die Basisrate der imaginären Fälle (95%) als unsere Schätzung der Wahrscheinlichkeit zu verwenden, dass unser tatsächlicher Fall das CI enthält?

Ich habe gesehen, wie Posts in Anlehnung an "das tatsächlich berechnete CI enthält entweder den Populationsmittelwert oder nicht, also ist seine Wahrscheinlichkeit entweder 1 oder 0" argumentiert haben, aber dies scheint eine seltsame Definition der Wahrscheinlichkeit zu implizieren, die abhängig ist bei unbekannten Zuständen (dh ein Freund wirft eine faire Münze um, verbirgt das Ergebnis, und ich kann nicht sagen, dass die Wahrscheinlichkeit, dass es sich um Köpfe handelt, bei 50% liegt).

Sicher irre ich mich, aber ich sehe nicht, wo meine Logik schief gelaufen ist ...


4
Meinen Sie mit "Zufall" "Wahrscheinlichkeit" im technischen oder im bayesianischen Sinne der subjektiven Plausibilität? Im häufigeren Sinne haben nur Ereignisse von Zufallsexperimenten eine Wahrscheinlichkeit. Das Betrachten von drei vorgegebenen (festen) Zahlen (wahrer Mittelwert, berechnete CI-Grenzen) zur Bestimmung ihrer Reihenfolge (wahrer Mittelwert in CI?) Ist kein Zufallsexperiment. Dies ist auch der Grund, warum der Wahrscheinlichkeitsteil von "das tatsächlich berechnete CI entweder den Populationsmittelwert enthält oder nicht, daher ist seine Wahrscheinlichkeit entweder 1 oder 0" ebenfalls falsch. Ein frequentistisches Wahrscheinlichkeitsmodell trifft in diesem Fall einfach nicht zu.
Karakal

11
Es hängt davon ab, wie Sie den theoretischen Mittelwert behandeln. Wenn es sich um eine Zufallsvariable handelt, können Sie über die Wahrscheinlichkeit sagen, dass sie in ein bestimmtes Intervall fällt. Wenn es konstant ist, können Sie nicht. Das ist die einfachste Erklärung, die dieses Thema für mich persönlich geschlossen hat.
mpiktas

2
Übrigens bin ich auf dieses Gespräch von Thaddeus Tarpey gestoßen: Alle Modelle haben Recht ... die meisten sind nutzlos . Er diskutierte die Frage nach der Wahrscheinlichkeit, dass ein 95% -Konfidenzintervall enthält (S. 81 ff.). μ
Chl

3
@Nesp: Ich glaube nicht, dass es ein Problem mit der Aussage "Es ist wahrscheinlich, dass es entweder null oder eins ist" in Bezug auf die (hintere) Wahrscheinlichkeit gibt, dass ein CI einen (festen) Parameter enthält. (Dies beruht nicht einmal wirklich auf einer häufigen Interpretation der Wahrscheinlichkeit!). Es stützt sich auch nicht auf "unbekannte Zustände". Eine solche Aussage bezieht sich genau auf die Situation, in der man aufgrund einer bestimmten Stichprobe ein CI erhält. Es ist eine einfache mathematische Übung, um zu zeigen, dass eine solche Wahrscheinlichkeit trivial ist, dh Werte in annimmt . {0,1}
Kardinal

3
@MikeLawrence nach drei Jahren sind Sie mit der Definition eines 95% -Konfidenzintervalls wie folgt zufrieden: "Wenn wir wiederholt eine Stichprobe aus der Grundgesamtheit erstellen und ein 95% -Konfidenzintervall nach jeder Stichprobe berechnen, würden 95% unseres Konfidenzintervalls den Mittelwert enthalten ". Wie Sie im Jahr 2012 bemühe ich mich zu sehen, dass dies nicht bedeutet, dass ein 95% -Konfidenzintervall eine Wahrscheinlichkeit von 95% hat, den Mittelwert zu enthalten. Es würde mich interessieren, wie sich Ihr Verständnis für ein Vertrauensintervall entwickelt hat, seit Sie diese Frage gestellt haben.
Luciano

Antworten:


107

Ein Teil des Problems besteht darin, dass die häufig verwendete Definition einer Wahrscheinlichkeit keine nicht-triviale Wahrscheinlichkeit für das Ergebnis eines bestimmten Experiments zulässt, sondern nur für eine fiktive Population von Experimenten, aus denen dieses bestimmte Experiment als Stichprobe betrachtet werden kann. Die Definition eines CI ist verwirrend, da es sich eher um eine Aussage zu dieser (normalerweise) fiktiven Population von Experimenten handelt als um die speziellen Daten, die in der vorliegenden Instanz gesammelt wurden. Teil des Problems ist also die Definition einer Wahrscheinlichkeit: Die Vorstellung, dass der wahre Wert innerhalb eines bestimmten Intervalls mit einer Wahrscheinlichkeit von 95% liegt, widerspricht einem frequentistischen Rahmen.

Ein weiterer Aspekt des Problems ist, dass bei der Berechnung des Frequentist Confidence nicht alle in der jeweiligen Stichprobe enthaltenen Informationen verwendet werden, die für die Begrenzung des wahren Werts der Statistik relevant sind. Meine Frage "Gibt es Beispiele, bei denen Bayes'sche glaubwürdige Intervalle offensichtlich häufigen Konfidenzintervallen unterlegen sind?"diskutiert ein Papier von Edwin Jaynes, das einige wirklich gute Beispiele enthält, die den Unterschied zwischen Konfidenzintervallen und glaubwürdigen Intervallen deutlich machen. Besonders relevant für diese Diskussion ist Beispiel 5, in dem der Unterschied zwischen einem glaubwürdigen und einem Konfidenzintervall für die Schätzung des Parameters einer abgeschnittenen Exponentialverteilung (für ein Problem bei der industriellen Qualitätskontrolle) erörtert wird. In dem von ihm angegebenen Beispiel gibt es genügend Informationen in der Stichprobe, um sicherzustellen, dass der wahre Wert des Parameters nirgendwo in einem richtig konstruierten 90% -Konfidenzintervall liegt!

Für manche mag dies schockierend erscheinen, aber der Grund für dieses Ergebnis ist, dass Konfidenzintervalle und glaubwürdige Intervalle Antworten auf zwei verschiedene Fragen sind, aus zwei unterschiedlichen Interpretationen der Wahrscheinlichkeit.

Das Konfidenzintervall ist die Antwort auf die Anfrage: "Geben Sie mir ein Intervall, das den wahren Wert des Parameters in % der Instanzen eines Experiments enthält, das häufig wiederholt wird." Das glaubwürdige Intervall ist eine Antwort auf die Anfrage: "Geben Sie mir ein Intervall, das den wahren Wert mit der Wahrscheinlichkeit eine Klammer setzt, die für die bestimmte Probe gilt, die ich tatsächlich beobachtet habe. " Um die letztere Anfrage beantworten zu können, müssen wir entweder (a ) ein neues Konzept des Datenerzeugungsprozesses oder (b) ein anderes Konzept der Definition der Wahrscheinlichkeit selbst. p100pp

Der Hauptgrund dafür, dass ein bestimmtes 95-Prozent-Konfidenzintervall keine 95-Prozent-Wahrscheinlichkeit für die Eindämmung des Mittelwerts impliziert, liegt darin, dass das Konfidenzintervall eine Antwort auf eine andere Frage ist. Es ist also nur die richtige Antwort, wenn die Antwort auf die beiden Fragen zutrifft haben die gleiche numerische Lösung.

Kurz, glaubwürdige und vertrauenswürdige Intervalle beantworten unterschiedliche Fragen aus unterschiedlichen Perspektiven. beide sind nützlich, aber Sie müssen das richtige Intervall für die Frage auswählen, die Sie tatsächlich stellen möchten. Wenn Sie ein Intervall wünschen, das eine Interpretation einer 95% igen (hinteren) Wahrscheinlichkeit des Enthaltens des wahren Werts zulässt, wählen Sie ein glaubwürdiges Intervall (und damit die damit verbundene Konzeptualisierung der Wahrscheinlichkeit) und kein Konfidenzintervall. Das, was Sie nicht tun sollten, ist, in der Interpretation eine andere Definition der Wahrscheinlichkeit als die in der Analyse verwendete zu verwenden.

Vielen Dank an @cardinal für seine Verfeinerungen!

Hier ist ein konkretes Beispiel aus David MaKays ausgezeichnetem Buch "Informationstheorie, Inferenz und Lernalgorithmen " (Seite 464):

Der interessierende Parameter sei und die Daten , ein Paar von Punkten und die unabhängig von der folgenden Verteilung gezogen werden:D x 1 x 2θDx1x2

p(x|θ)={1/2x=θ,1/2x=θ+1,0otherwise

Wenn ist , dann würden wir erwarten , die Datensätze zu sehen , , und alle mit gleicher Wahrscheinlichkeit . Betrachten Sie das Konfidenzintervallθ( 39 , 39 ) ( 39 , 40 ) ( 40 , 39 ) ( 40 , 40 ) 1 / 439(39,39)(39,40)(40,39)(40,40)1/4

[θmin(D),θmax(D)]=[min(x1,x2),max(x1,x2)] .

Dies ist eindeutig ein gültiges 75% -Konfidenzintervall, denn wenn Sie die Daten viele Male neu abgetastet haben , würde das auf diese Weise konstruierte Konfidenzintervall in 75% der Fälle den wahren Wert enthalten.D=(x1,x2)

Betrachten Sie nun die Daten . In diesem Fall wäre das häufigste 75% -Konfidenzintervall . Unter der Annahme, dass das Modell des Erzeugungsprozesses korrekt ist, könnte in diesem Fall 28 oder 29 sein, und wir haben keinen Grund anzunehmen, dass 29 wahrscheinlicher als 28 ist, so dass die hintere Wahrscheinlichkeit . Also in diesem Fall das frequentistischen Konfidenzintervall ist eindeutig kein 75% glaubhaftes Intervall , da es nur eine 50% ige Wahrscheinlichkeit, dass sie den wahren Wert enthalten , gegeben , was wir ableiten können aus dieser speziellen Probe .[ 29 , 29 ] θ p ( θ = 28 | D ) = p ( θ = 29 | D ) = 1 / 2 θ θD=(29,29)[29,29]θp(θ=28|D)=p(θ=29|D)=1/2θθ

Ja, dies ist ein erfundenes Beispiel, aber wenn Konfidenzintervalle und glaubwürdige Intervalle nicht unterschiedlich wären, wären sie in erfundenen Beispielen immer noch identisch.

Beachten Sie, dass der Hauptunterschied darin besteht, dass das Konfidenzintervall eine Aussage darüber ist, was passieren würde, wenn Sie das Experiment viele Male wiederholen. Das glaubwürdige Intervall ist eine Aussage darüber, was aus dieser bestimmten Stichprobe abgeleitet werden kann.


8
Das Konfidenzintervall ist die Antwort auf die Frage "Gib mir ein Intervall, in dem der wahre Wert der Statistik mit der Wahrscheinlichkeit p angegeben wird, wenn das Experiment viele Male wiederholt wird". Das glaubwürdige Intervall ist eine Antwort auf die Frage "gib mir ein Intervall, das den wahren Wert mit der Wahrscheinlichkeit p in Klammern setzt". Zunächst lässt die Aussage zu einer frequentistischen Wahrscheinlichkeitsinterpretation zu wünschen übrig. Vielleicht liegt das Problem in der Verwendung des Wortes Wahrscheinlichkeit in diesem Satz. Zweitens finde ich das glaubwürdige Intervall "Definition" etwas zu simpel ...
Kardinal

7
... und in Anbetracht der Charakterisierung, die Sie einem CI geben, etwas irreführend. In einem verwandten Sinne hat der Schlusssatz das gleiche Problem: Wenn Sie ein Intervall wünschen, das zu 95% den wahren Wert enthält, wählen Sie ein glaubwürdiges Intervall, kein Konfidenzintervall. Die umgangssprachliche Verwendung von "enthält zu 95% den wahren Wert" ist etwas ungenau und hinterlässt den falschen Eindruck. In der Tat kann ich ein überzeugendes Argument vorbringen (ich glaube), dass eine solche Formulierung der Definition eines CI sehr viel näher kommt.
Kardinal

11
Bitte : Es wäre hilfreich, wenn der Downvoter zu dieser Antwort seine Meinung / Gründe in den Kommentaren äußern würde. Obwohl diese Frage mit größerer Wahrscheinlichkeit zu längeren Diskussionen führt, ist es dennoch nützlich, den Antwortenden konstruktives Feedback zu geben. Dies ist eine der einfachsten Möglichkeiten, um den Gesamtinhalt der Website zu verbessern. Prost.
Kardinal

9
Dikran, ja, ich stimme zu. Das war ein Teil dessen, was ich versucht habe, in den Bearbeitungen ein bisschen mehr herauszuholen. Eine radikale frequentistischen (was ich bin sicher nicht ) könnte es erklären , provozierend als: „Ein CI konservativ ist, dass ich entwerfen das Intervall vorher , so dass unabhängig davon , welche insbesondere Daten , die ich beobachten passieren, wird der Parameter in dem Intervall von 95% erfasst werden Ein glaubwürdiges Intervall entsteht, wenn man sagt: "Hoppla, jemand hat nur ein paar Daten in meinen Schoß geworfen. Wie groß ist die Wahrscheinlichkeit, dass das Intervall, das ich aus diesen Daten konstruiere, den wahren Parameter enthält?" .
Kardinal

2
Dikran, wir alle haben unterschiedliche Hintergründe und das bereichert unser Verständnis. In Bezug auf Wahrscheinlichkeit und verwandte Konzepte hatte der vielleicht brillanteste Denker, mit dem ich interagieren durfte, weder eine formale Statistik noch einen (mathematischen) Wahrscheinlichkeitshintergrund. Er war Ingenieur.
Kardinal

28

In der frequentistischen Statistik handelt es sich bei Wahrscheinlichkeiten um Ereignisse auf lange Sicht. Sie gelten nur nicht für ein einzelnes Ereignis, nachdem es abgeschlossen ist. Ein solches Ereignis ist die Durchführung eines Experiments und die Berechnung des CI.

Du wolltest es mit der Wahrscheinlichkeit vergleichen, dass eine versteckte Münze Köpfe sind, aber das kannst du nicht. Sie können es auf etwas sehr Nahes beziehen. Wenn es in Ihrem Spiel eine Regel gab, nach der Sie nach dem Flip "Heads" angeben müssen, dann ist die Wahrscheinlichkeit, dass Sie auf lange Sicht richtig liegen, 50% und das ist analog.

Wenn Sie Ihr Experiment ausführen und Ihre Daten sammeln, haben Sie etwas Ähnliches wie den tatsächlichen Münzwurf. Der Prozess des Experiments ähnelt dem Prozess des Münzwurfs, indem er erzeugtμμoder es mag nicht nur die Münze ist Köpfe oder es ist nicht. Sobald Sie die Münze geworfen haben, ist es unwahrscheinlich, dass es sich um Köpfe handelt, entweder um Köpfe oder nicht. Angenommen, Sie rufen Köpfe an. Genau das ist die Berechnung des CI. Weil Sie die Münze niemals aufdecken können (Ihre Analogie zu einem Experiment würde verschwinden). Entweder du hast recht oder du liegst falsch, das war's. Hat der aktuelle Zustand etwas mit der Wahrscheinlichkeit zu tun, dass es beim nächsten Schlag auftaucht, oder hätte ich vorhersagen können, was es ist? Nein. Der Prozess, nach dem der Kopf hergestellt wird, hat eine Wahrscheinlichkeit von 0,5, aber das bedeutet nicht, dass ein bereits vorhandener Kopf eine Wahrscheinlichkeit von 0,5 hat. Sobald Sie Ihren CI berechnet haben, ist es unwahrscheinlich, dass er erfasstμEntweder funktioniert es oder nicht - Sie haben die Münze bereits geworfen.

OK, ich denke ich habe das genug gefoltert. Der entscheidende Punkt ist wirklich, dass Ihre Analogie falsch ist. Sie können die Münze niemals preisgeben. Sie können nur Heads oder Tails aufrufen, die auf Annahmen zu Münzen basieren (Experimente). Vielleicht möchten Sie eine Wette darauf abschließen, dass Ihre Kopf- oder Zahlwerte korrekt sind, aber Sie können niemals darauf sammeln. Außerdem ist es eine wichtige Komponente der CI-Prozedur, dass Sie angeben, dass der Wert des Imports im Intervall liegt. Wenn Sie dies nicht tun, haben Sie kein CI (oder zumindest kein CI bei den angegebenen%).

Wahrscheinlich ist es der Name, der das CI verwirrt. Es ist ein Wertebereich, der entweder enthält oder nicht . Wir denken, sie enthalten aber die Wahrscheinlichkeit dafür ist nicht die gleiche wie der Prozess, der in die Entwicklung gegangen ist. Der 95% -Teil des 95% -CI-Namens ist nur ein Teil des Prozesses. Sie können einen Bereich berechnen, von dem Sie glauben, dass er später mit einer gewissen Wahrscheinlichkeit enthält , dies ist jedoch eine andere Berechnung und kein CI.μ μμμμ

Es ist besser , den Namen 95% CI zu denken , als Bezeichnung einer Art von Messung einer Reihe von Werten , die Sie denken , plausibel enthalten und trennen Sie die 95% von dieser Plausibilität. Wir könnten es das Jennifer CI nennen, während das 99% CI das Wendy CI ist. Das könnte tatsächlich besser sein. Danach können wir sagen, dass wir glauben, dass wahrscheinlich im Wertebereich liegt, und niemand würde stecken bleiben und sagen, dass es eine Wendy-Wahrscheinlichkeit gibt, dass wir gefangen haben . Wenn Sie eine andere Bezeichnung wünschen, sollten Sie sich wahrscheinlich frei fühlen, auch den "Vertrauen" -Teil von CI loszuwerden (aber es ist ein Intervall).μ μμμμ


Fairerweise scheint diese Antwort in Ordnung zu sein, aber ich freue mich über eine formale (mathematische) Beschreibung. Mit formal meine ich, es in Ereignisse umzuwandeln. Ich erkläre meinen Punkt: Ich erinnere mich, dass ich zu Beginn sehr verwirrt war mit Werten. Irgendwo las ich, dass "was Werte tatsächlich berechnen, die Wahrscheinlichkeit der Daten ist, wenn die Nullhypothese wahr ist". Als ich dies mit dem Bayes-Theorem in Verbindung brachte, ergab alles so viel Sinn, dass ich es jetzt jedem erklären kann (dh, dass man berechnet ). Allerdings bin ich (ironischerweise) nicht so zuversichtlich ...pH 0 p ( D | H 0 )pH0p(D|H0)
Néstor

... (Fortsetzung) mit Vertrauensintervallen: Gibt es eine Möglichkeit, das auszudrücken, was Sie in Bezug auf Wissen gesagt haben? In freq. Statistiken. man berechnet normalerweise eine Punktschätzung, , mit einer Methode (zB MLE). Gibt es eine Möglichkeit, zu schreiben (z. B. mit einem bayesianischen zentralen posterioren Intervall, mit dem "wahren Mittelwert") als eine Funktion von (dh was ist der % der Konfidenzintervalle wirklich), als wenn Sie als ausdrücken können eine Funktion von ? Intuitiv habe ich immer gedacht, dass es getan werden kann, aber nie getan. P(L1( μ )<μ<L2( ^ m u )|D)μP(L ' 1 < ˉ X -μ<L 'μ^P(L1(μ^)<μ<L2(mu^)|D)μ& agr;p(H0|D)p(D|H0)P(L1<X¯μ<L2)=ααp(H0|D)p(D|H0)
Néstor

Das Löschen von Kommentaren hat manchmal auch Nachteile. In diesem Fall konnte ich mit den schnellen Veränderungen nicht Schritt halten!
Kardinal

1
" Wenn Sie Ihr Konfidenzintervall nicht berechnen, haben Sie etwas Ähnliches wie die versteckte Münze und es besteht eine 95% ige Wahrscheinlichkeit, dass sie mu enthält, genau wie die Münze eine 50% ige Wahrscheinlichkeit, ein Kopf zu sein. " die Analogie hier falsch. "Berechnung des CI" entspricht nicht dem Aufdecken der Münze, sondern dem Aufrufen von "Heads" oder "Tails". An diesem Punkt haben Sie noch eine 50-50-Chance, Recht zu haben. Das Aufdecken der Münze entspricht dem * Anzeigen des Bevölkerungswerts von . An diesem Punkt können Sie die Frage beantworten, ob der Wert im "aufgerufenen" Intervall liegt. Das Rätsel des OP bleibt bestehen. μ
Glen_b

1
@vonjd, ich verstehe nicht, was daran keinen Sinn ergibt. Es ist ganz offensichtlich der Fall, dass Ihr Gegner einen Flush hat oder nicht. Bei ersteren ist die Wahrscheinlichkeit (trivial) 1 und bei letzteren 0. Folglich kann man nicht sinnvoll sagen, dass die Wahrscheinlichkeit .198 ist. Das macht durchaus Sinn. Bevor Sie die Hand austeilen, ist es vernünftig, über die Wahrscheinlichkeit zu sprechen, dass Sie einen Flush erhalten. Ebenso ist es sinnvoll, vor dem Ziehen einer Karte über die Wahrscheinlichkeit zu sprechen, die Farbe zu erhalten, die Sie benötigen. Nachdem Sie die Karte haben, ist es einfach, welche Farbe es ist.
gung

22

Formale, explizite Vorstellungen über Argumente, Folgerungen und Logik entsprangen in der westlichen Tradition Aristoteles. Aristoteles schrieb über diese Themen in mehreren verschiedenen Werken (darunter eines, das sich Topics nennt ;-)). Das grundlegendste Prinzip ist jedoch das Gesetz der Widerspruchsfreiheit , das an verschiedenen Orten, einschließlich der Metaphysik, zu finden istBuch IV, Kapitel 3 & 4. Eine typische Formulierung lautet: "... es ist unmöglich, dass etwas zur gleichen Zeit [im gleichen Sinne] ist und nicht" (1006 a 1). Seine Bedeutung wird etwas früher festgestellt: "... das ist natürlich der Ausgangspunkt auch für alle anderen Axiome" (1005 b 30). Verzeihen Sie mir, dass ich philosophisch geworden bin, aber diese Frage hat naturgemäß einen philosophischen Inhalt, der aus Bequemlichkeitsgründen nicht einfach beiseite geschoben werden kann.

Denken Sie an dieses Gedankenexperiment: Alex wirft eine Münze um, fängt sie auf und legt sie mit der Hand nach oben auf den Unterarm. Bob stand genau in der richtigen Position; er sah kurz die Münze in Alex 'Hand und kann so ableiten, welche Seite jetzt nach oben zeigt. Carlos sah die Münze jedoch nicht - er war nicht an der richtigen Stelle. An diesem Punkt fragt Alex sie, wie hoch die Wahrscheinlichkeit ist, dass die Münze Köpfe zeigt. Carlos schlägt vor, dass die Wahrscheinlichkeit 0,5 ist, da dies die langfristige Häufigkeit von Köpfen ist. Bob ist anderer Meinung, er gibt zuversichtlich an, dass die Wahrscheinlichkeit nichts anderes als genau 0 ist .

Nun, wer hat Recht? Es ist natürlich möglich, dass Bob falsch gesehen hat (nehmen wir an, dass er nicht falsch gesehen hat). Trotzdem können Sie nicht beides für richtig halten und sich an das Gesetz der Widerspruchsfreiheit halten. (Ich nehme an, wenn Sie nicht an das Gesetz der Widerspruchsfreiheit glauben, könnten Sie beide für richtig halten oder eine andere solche Formulierung.) Stellen Sie sich jetzt einen ähnlichen Fall vor, aber ohne Bob könnte es Carlos Vorschlag sein mehr richtig (wie?) ohne bob rum, da keiner die münze gesehen hat? Die Anwendung des Gesetzes der Widerspruchsfreiheit ist in diesem Fall nicht ganz so klar, aber ich denke, es ist offensichtlich, dass die Teile der Situation, die wichtig erscheinen, von Ersterem zu Letzterem konstant gehalten werden. Es wurden viele Versuche unternommen, die Wahrscheinlichkeit zu definieren, und in Zukunft wird es möglicherweise noch viele weitere geben. Aber eine Definition der Wahrscheinlichkeit als Funktion dessen, wer gerade herumsteht und wo sie gerade positioniert sind, hat wenig Anziehungskraft. Auf jeden Fall (Vermutung durch die Verwendung der Phrase "Konfidenzintervall "), arbeiten wir im Rahmen des Frequentist-Ansatzes und dabei spielt es keine Rolle, ob jemand den wahren Zustand der Münze kennt. Es handelt sich nicht um eine Zufallsvariable - es handelt sich um einen realisierten Wert, der entweder Kopf oder Zahl anzeigt .

Wie @John bemerkt, scheint der Zustand einer Münze auf den ersten Blick nicht mit der Frage vergleichbar zu sein, ob ein Konfidenzintervall den wahren Mittelwert abdeckt. Anstelle einer Münze können wir dies jedoch abstrakt als einen realisierten Wert verstehen, der aus einer Bernoulli-Verteilung mit dem Parameter . In der Münzsituation ist , wohingegen für einen 95% -KI . Bei der Herstellung der Verbindung ist es wichtig zu erkennen, dass der wichtige Teil der Metapher nicht das , das die Situation regelt, sondern dass die umgedrehte Münze oder der berechnete CI ein realisierter Wert und keine Zufallsvariable ist. p = 0,5 p = 0,95 ppp=.5p=.95p

Mir ist an dieser Stelle wichtig anzumerken, dass dies alles im Rahmen einer frequentistischen Wahrscheinlichkeitsauffassung der Fall ist. Die Bayes'sche Perspektive verstößt nicht gegen das Gesetz der Widerspruchsfreiheit, sondern geht einfach von unterschiedlichen metaphysischen Annahmen über die Natur der Realität (genauer gesagt über die Wahrscheinlichkeit) aus. Andere auf CV sind viel besser in der Bayes - Perspektive versiert , als ich bin, und vielleicht können sie erklären , warum die Annahmen hinter Ihrer Frage innerhalb des Bayes - Ansatzes nicht anwendbar ist , und dass in der Tat, es kann gut sein , eine 95% ige Wahrscheinlichkeit , dass der Mittelwert innerhalb von 95% glaubwürdig liegenIntervall, unter bestimmten Bedingungen einschließlich (unter anderem), dass der zuvor verwendete genau war (siehe den Kommentar von @DikranMarsupial unten). Ich bin jedoch der Meinung, dass alle einverstanden sind, dass, wenn Sie einmal angeben, dass Sie im Frequentist-Ansatz arbeiten, die Wahrscheinlichkeit, dass der wahre Mittelwert in einem bestimmten 95% -KI liegt, nicht 0,95 beträgt.


5
Nach dem Bayes'schen Ansatz ist es nicht wahr, dass tatsächlich eine Wahrscheinlichkeit von 95% besteht, dass der wahre Wert in einem glaubwürdigen Intervall von 95% liegt. Es wäre richtiger zu sagen, dass bei einer bestimmten vorherigen Verteilung für den Wert der Statistik (die unseren anfänglichen Wissensstand darstellt), wenn wir die Daten betrachtet haben, eine hintere Verteilung vorliegt, die den aktualisierten Wissensstand darstellt, was uns ein Intervall gibt, in dem Wir sind zu 95% sicher, dass der wahre Wert liegt. Dies ist nur dann zutreffend, wenn unser Vorgänger zutreffend ist (und andere Annahmen wie die Form der Wahrscheinlichkeit).
Dikran Beuteltier

@DikranMarsupial, danke für den Hinweis. Das ist ein bisschen mundvoll. Ich bearbeitete meine Antwort es mehr im Einklang mit Ihrem Vorschlag zu machen, sie aber nicht kopierte in toto . Lassen Sie mich wissen, ob weitere Änderungen angebracht sind.
gung

Grundsätzlich lässt sich der Bayes'sche Ansatz am besten als Aussage über Ihren Kenntnisstand in Bezug auf den interessierenden Parameter interpretieren (siehe Kardinal, ich lerne; o), garantiert jedoch nicht, dass dieser Kenntnisstand korrekt ist, es sei denn, alle Annahmen stimmen . Ich habe die philosophische Diskussion genossen, ich muss mich daran erinnern, dass das Gesetz der Widerspruchsfreiheit das nächste Mal über Fuzzy-Logik diskutiert wird; o)
Dikran Beuteltier

12

Warum impliziert ein 95% CI keine 95% ige Chance, den Mittelwert zu enthalten?

In dieser Frage und in den meisten Antworten sind viele Fragen zu klären. Ich werde mich nur auf zwei von ihnen beschränken.

ein. Was bedeutet eine Bevölkerung? Existiert eine wahre Bevölkerung?

Das Konzept des Populationsmittelwerts ist modellabhängig. Da alle Modelle falsch sind, einige jedoch nützlich sind, handelt es sich bei diesem Populationsmittel um eine Fiktion, die nur definiert wird, um nützliche Interpretationen bereitzustellen. Die Fiktion beginnt mit einem Wahrscheinlichkeitsmodell.

Das Wahrscheinlichkeitsmodell wird durch das Triplet wobei der Probenraum (eine nicht leere Menge) ist, eine Familie ist von Teilmengen von und ist ein genau definiertes Wahrscheinlichkeitsmaß, das über (es regelt das Datenverhalten). Betrachten Sie ohne Einschränkung der Allgemeinheit nur den Einzelfall. Der Populationsmittelwert ist definiert durch er stellt die zentrale Tendenz unter und kann auch als Massenschwerpunkt von interpretiert werden alle Punkte in , wo das Gewicht von jedem

(X,F,P),
XFXPF
μ=xXxP(X=x),
PXxX ist gegeben durch .P(X=x)

In der Wahrscheinlichkeitstheorie wird das Maß als bekannt angesehen, daher ist der Populationsmittelwert durch die obige einfache Operation zugänglich. In der Praxis ist die Wahrscheinlichkeit jedoch kaum bekannt. Ohne eine Wahrscheinlichkeit kann man das probabilistische Verhalten der Daten nicht beschreiben. Da wir keine genaue Wahrscheinlichkeit zur Erklärung des Datenverhaltens festlegen können, setzen wir eine Familie die Wahrscheinlichkeitsmaße enthält, die möglicherweise das Datenverhalten bestimmen (oder erklären). Dann entsteht das klassische statistische Modell Das obige Modell soll ein parametrisches Modell sein, wenn es mit gibtPPPPM

(X,F,M).
ΘRpp< so, dass . Betrachten wir in diesem Beitrag nur das parametrische Modell.M{Pθ: θΘ}

Beachten Sie, dass es für jedes Wahrscheinlichkeitsmaß eine entsprechende mittlere Definition Das heißt, es gibt eine Familie von Bevölkerungsmitteln , die stark von der Definition von abhängt . Die Familie wird von begrenzten Menschen definiert und enthält daher möglicherweise nicht das wahre Wahrscheinlichkeitsmaß, das das Datenverhalten bestimmt. Tatsächlich wird die gewählte Familie kaum das wahre Maß enthalten, außerdem kann dieses wahre Maß nicht einmal existieren. Da das Konzept eines Populationsmittels von den Wahrscheinlichkeitsmaßen in abhängt , ist das Populationsmittel modellabhängig.PθM

μθ=xXxPθ(X=x).
{μθ: θΘ}MMM

Der Bayes'sche Ansatz betrachtet eine vorherige Wahrscheinlichkeit über die Teilmengen von (oder äquivalent ), aber in diesem Beitrag werde ich mich nur auf die klassische Version konzentrieren.MΘ

b. Was ist die Definition und der Zweck eines Konfidenzintervalls?

Wie bereits erwähnt, ist der Populationsmittelwert modellabhängig und liefert nützliche Interpretationen. Wir haben jedoch eine Familie von Populationsmitteln, da das statistische Modell durch eine Familie von Wahrscheinlichkeitsmaßen definiert ist (jedes Wahrscheinlichkeitsmaß erzeugt ein Populationsmittel). Basierend auf einem Experiment sollten daher Inferenzverfahren angewendet werden, um eine kleine Menge (Intervall) mit guten Kandidaten für Populationsmittelwerte zu schätzen. Eine wohlbekannte Prozedur ist der ( ) - Vertrauensbereich, der durch eine Menge ; definiert ist, so dass für alles ; woC α θ & THgr; P θ1αCαθΘ

Pθ(Cα(X)μθ)1α   and   infθΘPθ(Cα(X)μθ)=1α,
Pθ(Cα(X)=)=0P_θ (C_α (siehe Schervish, 1995). Dies ist eine sehr allgemeine Definition und umfasst praktisch jede Art von Konfidenzintervallen. Hier ist die Wahrscheinlichkeit , dass enthält unter der Maßnahme . Diese Wahrscheinlichkeit sollte immer größer als (oder gleich) , die Gleichheit tritt im ungünstigsten Fall auf.Pθ(Cα(X)μθ)Cα(X)μθPθ1α

Anmerkung: Die Leser sollten beachten, dass es nicht notwendig ist, Annahmen über den Zustand der Realität zu treffen. Der Vertrauensbereich wird für ein genau definiertes statistisches Modell definiert, ohne dass auf einen "wahren" Mittelwert Bezug genommen wird. Selbst wenn das "wahre" Wahrscheinlichkeitsmaß nicht existiert oder nicht in , funktioniert die Vertrauensbereichsdefinition, da sich die Annahmen eher auf die statistische Modellierung als auf die Zustände der Realität beziehen.M

Einerseits ist vor der Beobachtung der Daten eine Zufallsmenge (oder ein Zufallsintervall), und die Wahrscheinlichkeit, dass " den Mittelwert " enthält, ist mindestens für alles . Dies ist eine sehr wünschenswerte Eigenschaft für das frequentistische Paradigma.Cα(X)Cα(X)μθ(1α)θΘ

Auf der anderen Seite, nachdem die Daten beobachteten , nur ein fester Satz , und die Wahrscheinlichkeit , dass „ enthält die Mittel “ in sein sollte {0,1} für Alles .xCα(x)Cα(x)μθθΘ

Das heißt, nachdem wir die Daten , können wir die probabilistische Argumentation nicht mehr anwenden. Soweit ich weiß, gibt es keine Theorie zur Behandlung von Konfidenzsätzen für eine beobachtete Stichprobe (ich arbeite daran und erhalte einige gute Ergebnisse). Für eine Weile muss der Frequentist glauben, dass die beobachtete Menge (oder das beobachtete Intervall) eine der -Sätzen ist, die für alles .C α ( x ) ( 1 - α ) 100 % μ θ θ ΘxCα(x)(1α)100%μθθΘ

PS: Ich lade Kommentare, Rezensionen, Kritiken oder sogar Einwände zu meinem Beitrag ein. Lassen Sie es uns ausführlich besprechen. Da ich kein englischer Muttersprachler bin, enthält mein Beitrag sicherlich Tippfehler und Grammatikfehler.

Referenz:

Schervish, M. (1995), Theory of Statistics, 2. Aufl., Springer.


Möchte jemand darüber diskutieren?
Alexandre Patriota

4
Diskussionen können im Chat stattfinden, sind aber auf unserer Hauptseite nicht angebracht. Weitere Informationen zur Funktionsweise finden Sie in unserer Hilfe . In der Zwischenzeit bin ich verwirrt über die Formatierung Ihres Beitrags: Fast alles ist als Zitat formatiert. Haben Sie dieses Material aus einer veröffentlichten Quelle extrahiert oder ist es Ihr eigenes, neu für diese Antwort geschriebenes? In letzterem Fall entfernen Sie bitte die Anführungszeichen!
Whuber

2
(+1). Vielen Dank für eine beeindruckend klare Zusammenfassung. Willkommen auf unserer Webseite!
Whuber

11

Ich bin überrascht, dass niemand das Beispiel von Berger für ein im Wesentlichen nutzloses 75% -Konfidenzintervall angesprochen hat, das im zweiten Kapitel des "Likelihood-Prinzips" beschrieben ist. Die Details finden Sie im Originaltext (der kostenlos in Project Euclid zur Verfügung steht ): Das Wesentliche an dem Beispiel ist, dass es eindeutig eine Situation beschreibt, in der Sie den Wert eines scheinbar unbekannten Parameters mit absoluter Sicherheit kennen Beobachten von Daten, aber Sie würden behaupten, dass Sie nur zu 75% sicher sind, dass Ihr Intervall den wahren Wert enthält. Das Durcharbeiten der Details dieses Beispiels ermöglichte es mir, die gesamte Logik der Erstellung von Konfidenzintervallen zu verstehen.


8
In einer frequentistischen Umgebung würde man nicht "behaupten, dass Sie nur zu 75% sicher sind, dass Ihr Intervall den wahren Wert enthält", und zwar in Bezug auf ein CI. Hier liegt der Kern des Problems. :)
Kardinal

1
Können Sie einen direkten Link / Seitenverweis auf dieses Beispiel bereitstellen? Ich habe das Kapitel durchsucht, konnte aber das richtige Beispiel nicht finden.
Ronald

@Ronald: Es ist das erste auf der ersten Seite von Kapitel 2. Ein direkter Link wäre eine willkommene Ergänzung.
Kardinal

1
Link wie gewünscht. Ah ja. In diesem Beispiel scheint es klar: Wenn wir ein Experiment machen, gibt es eine 75% ige Chance , dass das resultierende Konfidenzintervall wird die mittlere enthalten. Sobald wir das Experiment durchgeführt haben und wissen, wie es abgelaufen ist, kann diese Wahrscheinlichkeit abhängig von der Verteilung der resultierenden Stichprobe unterschiedlich sein.
Ronald

7

Ich weiß nicht, ob dies als neue Frage gestellt werden soll, aber es geht um die gleiche Frage, die oben gestellt wurde, indem ein Gedankenexperiment vorgeschlagen wird.

Erstens gehe ich davon aus, dass die Wahrscheinlichkeit, dass ich einen Verein ausgewählt habe (ohne ihn anzusehen), 13/52 = 25% beträgt, wenn ich zufällig eine Spielkarte aus einem Standardstapel auswähle.

Und zweitens wurde vielfach festgestellt, dass ein 95% -Konfidenzintervall dahingehend interpretiert werden sollte, dass ein Experiment mehrmals wiederholt wird und das berechnete Intervall den wahren Mittelwert von 95% der Zeit enthält - ich denke, dies wurde von James Waters einigermaßen überzeugend demonstriert Simulation. Die meisten Menschen scheinen diese Interpretation eines 95% -KI zu akzeptieren.

Nun zum Gedankenexperiment. Nehmen wir an, wir haben eine normalverteilte Variable in einer großen Population - vielleicht die Höhe erwachsener Männer oder Frauen. Ich habe einen willigen und unermüdlichen Assistenten, den ich damit beauftrage, mehrere Stichprobenverfahren einer bestimmten Stichprobengröße aus der Grundgesamtheit durchzuführen und den Stichprobenmittelwert und das 95% -Konfidenzintervall für jede Stichprobe zu berechnen. Mein Assistent ist sehr interessiert und schafft es, alle möglichen Proben aus der Bevölkerung zu messen. Dann zeichnet mein Assistent für jede Probe entweder das resultierende Konfidenzintervall als grün (wenn das CI den wahren Mittelwert enthält) oder rot (wenn das CI den wahren Mittelwert nicht enthält) auf. Leider zeigt mir mein Assistent die Ergebnisse seiner Experimente nicht an. Ich brauche einige Informationen über die Größe der Erwachsenen in der Bevölkerung, aber ich habe nur Zeit, Ressourcen und Geduld, um das Experiment einmal durchzuführen. Ich mache eine einzelne Zufallsstichprobe (mit der gleichen Stichprobengröße, die mein Assistent verwendet) und berechne das Konfidenzintervall (mit der gleichen Gleichung).

Ich habe keine Möglichkeit, die Ergebnisse meiner Assistentin zu sehen. Wie groß ist die Wahrscheinlichkeit, dass die von mir ausgewählte Zufallsstichprobe einen grünen CI ergibt (dh das Intervall enthält den wahren Mittelwert)?

In meinen Augen entspricht dies der oben beschriebenen Kartenspielsituation und kann mit einer Wahrscheinlichkeit von 95% interpretiert werden, dass das berechnete Intervall den wahren Mittelwert enthält (dh grün ist). Die Übereinstimmung scheint jedoch zu sein, dass ein 95% -Konfidenzintervall NICHT als eine 95% -Wahrscheinlichkeit interpretiert werden kann, dass das Intervall den wahren Mittelwert enthält. Warum (und wo) fällt meine Argumentation im obigen Gedankenexperiment auseinander?


+1 Dies ist eine bemerkenswert klare Darstellung des konzeptionellen Fortschritts von einer normalen Grundgesamtheit zu einer binären Stichprobensituation. Vielen Dank, dass Sie es mit uns teilen, und herzlich willkommen auf unserer Website!
whuber

Bitte poste dies als Frage.
John

Danke für den Kommentar, John. Habe jetzt als separate Frage gepostet ( stats.stackexchange.com/questions/301478/… ).
user1718097

4

Obwohl die zahlreichen tollen Antworten ausführlich diskutiert wurden, möchte ich eine einfachere Perspektive hinzufügen. (obwohl dies in anderen Antworten angedeutet wurde - aber nicht explizit). Für einige Parameter ; und bei gegebener Stichprobe ist ein eine Wahrscheinlichkeitsangabe des Formularsθ(X1,X2,,Xn)100p%

P(g(X1,X2,,Xn)<θ<f(X1,X2,,Xn))=p

Wenn wir als Konstante betrachten, dann handelt es sich bei der obigen Aussage um die Zufallsvariablen und oder genauer gesagt um das zufällige Intervall .g ( X 1 , X 2 , , X n ) f ( X 1 , X 2 , , X n ) ( g ( X 1 , X 2 , , X n ) , f ( X 1 , X 2 , , X n ) )θg(X1,X2,,Xn)f(X1,X2,,Xn)(g(X1,X2,,Xn),f(X1,X2,,Xn))

Anstatt also Informationen über die Wahrscheinlichkeit zu geben, dass der Parameter im Intervall enthalten ist, gibt es Informationen über die Wahrscheinlichkeit, dass das Intervall den Parameter enthält - da das Intervall aus Zufallsvariablen besteht.


3

Aus praktischen Gründen können Sie nicht mehr falsch wetten, dass Ihr 95% -CI den wahren Mittelwert bei einer Quote von 95: 5 enthält, als auf den Münzwurf Ihres Freundes bei einer Quote von 50:50 zu wetten.

Wenn Ihr Freund die Münze bereits geworfen hat und Sie glauben, dass die Wahrscheinlichkeit, dass es sich um Köpfe handelt, bei 50% liegt, verwenden Sie einfach eine andere Definition des Wortes Wahrscheinlichkeit. Wie andere gesagt haben, können Sie für Frequentisten einem aufgetretenen Ereignis keine Wahrscheinlichkeit zuweisen, sondern Sie können die Wahrscheinlichkeit eines zukünftigen Ereignisses anhand eines bestimmten Prozesses beschreiben.

Aus einem anderen Blog: Der Frequentist wird sagen: "Ein bestimmtes Ereignis kann keine Wahrscheinlichkeit haben. Die Münze zeigt entweder Kopf oder Zahl, und wenn Sie es nicht zeigen, kann ich einfach nicht sagen, was die Tatsache ist. Nur wenn Sie den Wurf wiederholen würden Viele, viele Male, wenn Sie die Anfangsbedingungen der Würfe stark genug variieren, würde ich erwarten, dass sich die relative Häufigkeit der Köpfe in all diesen vielen Würfen 0,5 "nähert. http://www.researchgate.net/post/Was_ist_der_Unterschied_zwischen_frequentist_und_bayesianischer_Wahrscheinlichkeit?


2
Dieser Blog klingt wie ein Strohmann-Streit. Es scheint eine Wahrscheinlichkeitsphilosophie mit einer Art (nicht vorhandenen) inhärenten Einschränkung der Fähigkeit zu verwechseln, Wahrscheinlichkeitsmodelle zu erstellen. Ich erkenne in dieser Charakterisierung keine Form klassischer statistischer Verfahren oder Methoden. Dennoch denke ich, dass Ihre abschließende Schlussfolgerung eine gute ist - aber die Sprache, die verwendet wird, indem nicht klargestellt wird, dass die Wette das CI und nicht den Mittelwert betrifft , kann zu einer Form von Verwirrung führen, die mit dieser Frage angegangen werden soll.
whuber

1
Eine häufig verwendete Methode besteht darin, zu betonen, dass das CI das Ergebnis eines Verfahrens ist. Was mir an Ihrer endgültigen Aussage gefällt, ist, dass sie leicht in einer solchen Form neu formuliert werden kann, wie in "Es ist nicht mehr falsch, bei einer Quote von 95: 5 zu wetten, dass Ihr 95% -Konfidenzintervall den wahren Mittelwert überdeckt hat, als Sie auf den Münzwurf deines Freundes mit einer Quote von 50:50 setzen. "
whuber

OK, habe es geändert.
Nigelhenry

2

Angenommen, das CI, das Sie aus dem jeweiligen Datensatz berechnet haben, ist eines der 5% der möglichen CIs, die den Mittelwert nicht enthalten. Wie nah ist es an dem glaubwürdigen 95% -Intervall, das Sie sich vorstellen möchten? (Das heißt, wie nahe ist es, den Mittelwert mit einer Wahrscheinlichkeit von 95% zu enthalten?) Sie können nicht sicher sein, dass er überhaupt nahe ist. Tatsächlich überschneidet sich Ihr CI möglicherweise nicht mit einem der 95% der 95% CIs, die tatsächlich den Mittelwert enthalten. Ganz zu schweigen davon, dass es nicht den Mittelwert selbst enthält, was auch darauf hindeutet, dass es kein zu 95% glaubwürdiges Intervall ist.

Vielleicht möchten Sie dies ignorieren und optimistisch annehmen, dass Ihr CI einer der 95% ist, die den Mittelwert enthalten. OK, was wissen wir über Ihr CI, da es zu 95% besteht? Dass es den Mittelwert enthält, aber vielleicht nur einen Ausweg im Extremfall, alles andere auf der anderen Seite des Mittelwerts ausschließt. Enthält wahrscheinlich nicht 95% der Distribution.

Auf jeden Fall gibt es keine Garantie, vielleicht auch nicht die vernünftige Hoffnung, dass Ihr 95% CI ein zu 95% glaubwürdiges Intervall ist.


Ich bin gespannt auf den ersten Absatz. Vielleicht verstehe ich es falsch, aber das Argument scheint ein wenig im Widerspruch zu der Tatsache zu stehen, dass es mehrere Beispiele gibt, in denen CIs und glaubwürdige Intervalle für alle möglichen Beobachtungen übereinstimmen . Was habe ich vermisst?
Kardinal

@ Kardinal: Ich kann mich irren. Ich habe den allgemeinen Fall angesprochen, aber ich würde davon ausgehen, dass es in dem Fall, in dem CI und glaubwürdiges Intervall identisch sind, andere Einschränkungen wie die Normalität gibt, die verhindern, dass die CIs zu weit entfernt sind.
Wayne

Mein Fokus war am stärksten auf den letzten Satz im Absatz gerichtet; Das Beispiel von zufälligen Intervallen sollte einen Punkt hervorheben. Sie könnten überlegen, ob Sie diesen Satz wirklich glauben oder nicht. :)
Kardinal

Meinen Sie, dass ein 95% -KI nicht bedeutet, dass 5% den Mittelwert nicht enthalten? Ich sollte sagen "per definitionem muss nicht einmal der Mittelwert selbst enthalten"? Oder fehle ich noch mehr?
Wayne

Wayne, wie verhindert die Tatsache, dass ein bestimmtes Intervall nicht den Mittelwert enthält, dass es ein gültiges glaubwürdiges Intervall ist? Verstehe ich diese Bemerkung falsch?
Kardinal

2

(dh ein Freund wirft eine faire Münze um, verbirgt das Ergebnis und ich kann nicht sagen, dass die Wahrscheinlichkeit, dass es sich um Köpfe handelt, bei 50% liegt.)

Wenn Sie nur raten, dass Ihre Freunde mit 50% Kopf / Zahl Münzwürfe machen, dann machen Sie es nicht richtig.

  • Sie sollten versuchen, die Münze nach / nach der Landung und bevor das Ergebnis ausgeblendet wird, schnell zu betrachten.
  • Sie sollten auch versuchen, im Voraus eine Vorausschätzung der Fairness der Münze zu erstellen.

Sicherlich hängt die Glaubwürdigkeit Ihrer Vermutung über den Münzwurf von diesen Bedingungen ab und ist nicht immer gleich 50% (manchmal funktioniert Ihre Methode des "Betrügens" besser).

Ihre allgemeine Vermutung könnte sein, wenn Sie betrügen, x> 50% der Zeit richtig, aber das bedeutet nicht unbedingt, dass die Wahrscheinlichkeit für jeden bestimmten Wurf konstant x% Köpfe betrug. Es wäre also etwas seltsam, Ihre Gesamtwahrscheinlichkeit auf die Wahrscheinlichkeit für einen bestimmten Wurf zu projizieren. Es ist eine andere Art von Wahrscheinlichkeit.


Es geht ein bisschen darum, auf welcher Ebene oder Tiefe Sie 'Wahrscheinlichkeit' angeben / definieren .

  • Das Vertrauen ist unabhängig von der "spezifischen Wahrscheinlichkeit in dem bestimmten Experiment / Flip" und unabhängig von den "a priori Wahrscheinlichkeiten" .

  • Das Vertrauen geht es um das Ensemble von Experimenten . Es ist so konstruiert, dass Sie keine A-priori-Wahrscheinlichkeiten oder -Verteilungen in der Population kennen müssen.

  • Das Vertrauen bezieht sich auf die Gesamtversagensrate der Schätzung, aber in bestimmten Fällen kann man möglicherweise Abweichungen in der Wahrscheinlichkeit genauer angeben .

    ( Diese Variationen der Wahrscheinlichkeit existieren zumindest implizit in der Theorie, und wir brauchen sie nicht zu kennen, damit sie existieren. Wir können diese Wahrscheinlichkeiten jedoch explizit mit einem Bayes'schen Ansatz ausdrücken.)


Beispiel 1:

Angenommen, Sie suchen nach einer sehr seltenen Krankheit. Sie führen einen Test durch, der als Bernoulli-Studie (positiv oder negativ) angesehen werden kann und einen hohen für ein positives Ergebnis bei Krankheit oder einen niedrigen bei Nichtkrankheit aufweist.p=0.99p=0.01

Nun wird dies normalerweise nicht (in der klinischen Praxis) durchgeführt, um ein CI-Intervall für zu schätzen, aber Sie können dies (als Beispiel) tun, wenn Sie möchten. Wenn der Test positiv ist, schätzen Sie und wenn der Test negativ ist, schätzen Sie .p0.05p10p0.95

Wenn Sie 1% der Bevölkerung krank haben, erhalten Sie im Durchschnitt 1,98% der positiven Testergebnisse (1% der 99% der gesunden Personen sind positiv und 99% der 1% der kranken Personen sind positiv). Dies macht Ihr 95% CI-Intervall (bedingt), wenn Sie auf einen positiven Test stoßen , nur in 50% der Fälle korrekt.

Wenn Sie dagegen auf einen negativen Test stoßen, sind Sie zu mehr als 95% der Zeit korrekt, sodass Ihre CI-Intervallschätzung insgesamt (mindestens) zu 95% der Zeit korrekt ist, jedoch von Fall zu Fall (für bestimmte Fälle) ) kann man nicht wirklich sagen, dass die Wahrscheinlichkeit für innerhalb des Intervalls 95% beträgt. Es gibt wahrscheinlich einige Variationen.p

Beispiel 2:

Angenommen, Sie lassen 300 IQ-Fragen ausführen. Von der naiven Konfidenzintervall und frequentistischen Sicht könnte man davon ausgehen , dass jede Person eine theoretische persönliche hat Verteilung für die Prüfung Leistung und auf Grund der beobachteten Test Leistung könnten Sie einige Schätzung für ein Intervall erstellen so dass Sie in 95% der Fälle das in dem Intervall richtig enthalten werden.iN(μi,σi2)μi

Dies ignoriert, dass es eine Auswirkung der Regression auf den Mittelwert gibt und dass die A-priori-Wahrscheinlichkeit für den IQ einer Person als . In extremen Fällen, niedrig oder hoch, ist das Ergebnis der Ergebnisse, die Wahrscheinlichkeit des IQ einer Person in den 95% -Konfidenzintervallen basierend auf den Messungen / Tests niedriger als die 95%.μiN(100,15)

(Das Gegenteil gilt für Personen mit Ergebnissen nahe 100. Ihr IQ liegt wahrscheinlich über 95% innerhalb des 95% -CI, und dies sollte die Fehler ausgleichen, die Sie im Extremfall begangen haben, sodass Sie am Ende Recht haben in 95% der Fälle)


2

Definieren wir zunächst das Konfidenzintervall oder in Räumen mit einer Dimension größer als eins den Konfidenzbereich. Die Definition ist eine prägnante Version derjenigen, die Jerzy Neyman 1937 in seiner Abhandlung an die Royal Society gegeben hat.

Sei der Parameter und die Statistik . Jeder mögliche Parameterwert ist einem Akzeptanzbereich für den , wobei der Konfidenzkoeffizient oder das Konfidenzniveau (normalerweise 0,95) ist und die Hintergrundinformationen sind, die wir zur Definition unserer Wahrscheinlichkeiten benötigen . Der Vertrauensbereich für ist dann , wenn ist .pspA(p,α)prob(sA(p,α)|p=p,I)=ααIps=sC(s,α)={p|sA(p,α)}

Mit anderen Worten, die Parameterwerte, die den Konfidenzbereich bilden, sind nur diejenigen, deren entsprechender agr; -Wahrscheinlichkeitsbereich des Probenraums die Statistik enthält.α

Betrachten Sie nun für jeden möglichen Parameterwert :p

[pC(s,α)]prob(s=s|p=p,I)ds=[sA(p,α)]prob(s=s|p=p,I)ds=α

wobei die eckigen Klammern Iverson-Klammern sind. Dies ist das Schlüsselergebnis für ein Konfidenzintervall oder eine Region. Es besagt , dass die Erwartung , unter der Stichprobenverteilung abhängig wird . Dieses Ergebnis wird durch die Konstruktion der Akzeptanzbereiche garantiert und gilt außerdem für , da ein möglicher Parameterwert ist. Es ist jedoch keine Wahrscheinlichkeitsangabe über , da Erwartungen keine Wahrscheinlichkeiten sind![pC(s,α)]pαppp

Die Wahrscheinlichkeit, für die diese Erwartung häufig falsch ist, ist die Wahrscheinlichkeit , dass der Parameter unter der Bedingung im Vertrauensbereich liegt:s=s

prob(pC(s,α)|s=s,I)=C(s,α)prob(s=s|p=p,I)prob(p=p|I)dpprob(s=s|p=p,I)prob(p=p|I)dp

Diese Wahrscheinlichkeit reduziert sich auf nur für bestimmte Kombinationen von Informationen und Abnahmeregionen . Wenn beispielsweise der Prior gleich ist und die Stichprobenverteilung in und symmetrisch ist (z. B. ein Gaußscher Wert mit als Mittelwert), gilt Folgendes:αIA(p,α)spp

prob(pC(s,α)|s=s,I)=C(s,α)prob(s=p|p=s,I)dpprob(s=p|p=s,I)dp=prob(sC(s,α)|p=s,I)=prob(sA(s,α)|p=s,I)

Wenn zusätzlich die Akzeptanzbereiche so sind, dass , dann:sA(s,α)sA(s,α)

prob(pC(s,α)|s=s,I)=prob(sA(s,α)|p=s,I)=α

Das Lehrbuchbeispiel für die Schätzung eines Populationsmittelwerts mit einem Standard-Konfidenzintervall, das anhand einer normalen Statistik erstellt wurde, ist ein Sonderfall der vorhergehenden Annahmen. Deshalb ist das Standard - 95% Konfidenzintervall tut enthält den Mittelwert mit Wahrscheinlichkeit 0,95; aber diese Entsprechung gilt im Allgemeinen nicht.


-1

Es gibt hier einige interessante Antworten, aber ich dachte, ich würde eine kleine praktische Demonstration mit R hinzufügen. Wir haben diesen Code kürzlich in einem Statistikkurs verwendet, um die Funktionsweise von Konfidenzintervallen hervorzuheben. Der Code bewirkt Folgendes:

1 - Stichproben aus einer bekannten Verteilung (n = 1000)

2 - Es wird der 95% CI für den Mittelwert jeder Probe berechnet

3 - Es wird gefragt, ob der CI jeder Stichprobe den wahren Mittelwert enthält oder nicht.

4 - In der Konsole wird der Bruchteil der CIs angezeigt, die den wahren Mittelwert enthielten.

Ich habe das Skript nur ein paar Mal ausgeführt, und es ist eigentlich nicht ungewöhnlich, dass weniger als 94% der CIs den wahren Mittelwert enthielten. Dies hilft mir zumindest dabei, die Vorstellung zu zerstreuen, dass ein Konfidenzintervall mit einer Wahrscheinlichkeit von 95% den wahren Parameter enthält.

#   In the following code, we simulate the process of
#   sampling from a distribution and calculating
#   a confidence interval for the mean of that 
#   distribution.  How often do the confidence
#   intervals actually include the mean? Let's see!
#
#   You can change the number of replicates in the
#   first line to change the number of times the 
#   loop is run (and the number of confidence intervals
#   that you simulate).
#
#   The results from each simulation are saved to a
#   data frame.  In the data frame, each row represents
#   the results from one simulation or replicate of the 
#   loop.  There are three columns in the data frame, 
#   one which lists the lower confidence limits, one with
#   the higher confidence limits, and a third column, which
#   I called "Valid" which is either TRUE or FALSE
#   depending on whether or not that simulated confidence
#   interval includes the true mean of the distribution.
#
#   To see the results of the simulation, run the whole
#   code at once, from "start" to "finish" and look in the
#   console to find the answer to the question.    

#   "start"

replicates <- 1000

conf.int.low <- rep(NA, replicates)
conf.int.high <- rep(NA, replicates)
conf.int.check <- rep(NA, replicates)

for (i in 1:replicates) {

        n <- 10
        mu <- 70
        variance <- 25
        sigma <- sqrt(variance)
        sample <- rnorm(n, mu, sigma)
        se.mean <- sigma/sqrt(n)
        sample.avg <- mean(sample)
        prob <- 0.95
        alpha <- 1-prob
        q.alpha <- qnorm(1-alpha/2)
        low.95 <- sample.avg - q.alpha*se.mean
        high.95 <- sample.avg + q.alpha*se.mean

        conf.int.low[i] <- low.95
        conf.int.high[i] <- high.95
        conf.int.check[i] <- low.95 < mu & mu < high.95
 }    

# Collect the intervals in a data frame
ci.dataframe <- data.frame(
        LowerCI=conf.int.low,
        UpperCI=conf.int.high, 
        Valid=conf.int.check
        )

# Take a peak at the top of the data frame
head(ci.dataframe)

# What fraction of the intervals included the true mean?
ci.fraction <- length(which(conf.int.check, useNames=TRUE))/replicates
ci.fraction

    #   "finish"

Hoffe das hilft!


2
Entschuldigung für die Kritik, aber ich musste diese Antwort (vorübergehend) ablehnen. Ich glaube, es ist ein Missverständnis der Bedeutung eines Konfidenzintervalls, und ich hoffe aufrichtig, dass dies nicht das Argument war, das in Ihrer Klasse verwendet wurde. Die Simulationen reduzieren sich auf ein (recht aufwändiges) Binomial-Sampling-Experiment.
Kardinal

5
@ Kardinal Nun ... er benutzt nur die langfristige Interpretation von Frequentist-Statistiken. Stichprobe aus der Grundgesamtheit: Berechnen Sie den CI so oft, und Sie stellen fest, dass der wahre Mittelwert in 95% der Fälle im CI enthalten ist (für ). Zumindest war mir das ziemlich klar. 1α=0.95
Néstor

4
"Weniger als 94%" in einer Stichprobe von 1000 CIs ist sicherlich kein signifikanter Beweis gegen die Vorstellung, dass 95% der CIs den Mittelwert enthalten. In der Tat würde ich erwarten, dass 95% der CIs in diesem Fall tatsächlich den Mittelwert enthalten.
Ronald

3
@Ronald: Ja, das war genau mein Punkt bei den Kommentaren, aber du hast es viel einfacher und prägnanter gesagt . Vielen Dank. Wie in einem der Kommentare angegeben, werden in 8,7% der Fälle 940 oder weniger Erfolge verzeichnet, und dies gilt für jeden CI von genau 95%, den man im Verlauf von 1000 Experimenten erstellt. :)
Kardinal

2
@JamesWaters: Vielen Dank, dass Sie sich die Zeit genommen haben, um zu antworten. Der Code ist in Ordnung, aber ich sehe nicht, wie er "Fälle demonstriert, in denen er falsch ist". Können Sie diese Absicht erklären? Ich vermute immer noch, dass es hier ein grundlegendes Missverständnis geben könnte. Sie scheinen zu verstehen, was I CI ist und wie man es richtig interpretiert, aber das Simulationsexperiment antwortet nicht auf die Frage, auf die Sie zu antworten scheinen. Ich denke, diese Antwort hat Potenzial, also würde ich gerne sehen, dass sie mit einem netten Schnitt endet, um den Punkt zu verdeutlichen, den Sie vermitteln möchten. Prost. :)
Kardinal
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.