Sind alle Werte innerhalb eines 95% -Konfidenzintervalls gleich wahrscheinlich?

56

Ich habe widersprüchliche Informationen zu der Frage gefunden: " Wenn man ein 95% -Konfidenzintervall (CI) aus einer Differenz der Mittelwerte oder einer Differenz der Anteile erstellt, sind alle Werte innerhalb des CI gleich wahrscheinlich? Oder ist die Punktschätzung die wahrscheinlichste mit Werten in der Nähe der "Schwänze" des CI weniger wahrscheinlich als in der Mitte des CI?

Wenn zum Beispiel ein randomisierter klinischer Studienbericht besagt, dass das relative Mortalitätsrisiko bei einer bestimmten Behandlung 1,06 beträgt (95% CI 0,96 bis 1,18), ist die Wahrscheinlichkeit, dass 0,96 der richtige Wert ist, die gleiche wie 1,06?

Ich habe online viele Hinweise auf dieses Konzept gefunden, aber die folgenden beiden Beispiele spiegeln die darin enthaltene Unsicherheit wider:

Lisa Sullivans Modul über Konfidenzintervalle lautet:

Die Konfidenzintervalle für die liefern einen Bereich wahrscheinlicher Werte für ( ). Es ist wichtig zu beachten, dass alle Werte im Konfidenzintervall gleich wahrscheinlich Schätzungen des wahren Werts von ( ) sind. $μ_1-μ_2$ $μ_1-μ_2$
Dieser Blogpost mit dem Titel Within the Margin of Error lautet:

Was ich im Sinn habe, ist ein Missverständnis über die „Fehlerquote“, die alle Punkte innerhalb des Konfidenzintervalls gleich wahrscheinlich behandelt, als ob der zentrale Grenzwertsatz eine begrenzte Gleichverteilung anstelle einer t- Verteilung impliziert . [...]
Das, was über "Fehlertoleranz" spricht, ist, dass Möglichkeiten, die nahe an der Punktschätzung liegen, viel wahrscheinlicher sind als Möglichkeiten, die am Rande der Grenze liegen ".

Diese scheinen widersprüchlich, also was ist richtig?

confidence-interval

— pmgjones
quelle

7

Ich frage mich, ob es irgendwo eine Verwechslung mit dem verwandten Konzept gibt, dass p-Werte unter der Nullhypothese gleichmäßig verteilt sind.

— Michael McGowan,

4

Das erste Zitat ist ein fehlerhafter Fehler in einer ansonsten genauen Darstellung der Vertrauensintervalle. Das zweite Zitat stammt aus einem Bericht, der, um es gut auszudrücken, schlampig ist: Es steckt voller Aussagen, die vage, falsch oder nur im Bayes'schen Sinne interpretierbar sind. Aber beide Zitate sind falsch !

— whuber

@whuber Ich würde das zweite nicht als Chaos bezeichnen ... Ich würde es als Bayes'sche Interpretation der Frequentist-Interpretation bezeichnen :)

— Michael McGowan

1

@Michael Ein Beispiel für Schlamperei ist die Behauptung, die CLT impliziere eine "unendliche Anzahl wiederholter Schätzungen des Mittelwerts [der Bevölkerung], der immer noch einer Normalverteilung folgt". Man muss sich nicht irren , um Ideen einfach einem nichttechnischen Publikum zu vermitteln.

— whuber

2

@whuber, ich betrachte den Satz, den du zitierst, nur als kleine Sünde. Der Hauptfehler ist, dass CLT keine Verteilung beinhaltet.

— glasigen

23

Eine Frage, die beantwortet werden muss, ist, was "wahrscheinlich" in diesem Zusammenhang bedeutet.

Wenn es sich um eine Wahrscheinlichkeit handelt (wie es manchmal als Synonym für verwendet wird) und wir strenge frequentistische Definitionen verwenden, dann ist der wahre Parameterwert ein einzelner Wert, der sich nicht ändert, sodass die Wahrscheinlichkeit (Wahrscheinlichkeit) für diesen Punkt 100% und alles ist andere Werte sind 0%. So sind fast alle gleich wahrscheinlich bei 0%, aber wenn das Intervall den wahren Wert enthält, dann ist es anders als die anderen.

Wenn wir einen Bayes'schen Ansatz verwenden, stammt das CI (Credible Interval) aus der posterioren Verteilung und Sie können die Wahrscheinlichkeit an den verschiedenen Punkten innerhalb des Intervalls vergleichen. Wenn der hintere Teil innerhalb des Intervalls nicht vollkommen gleichmäßig ist (theoretisch möglich, aber das wäre ein merkwürdiger Umstand), haben die Werte unterschiedliche Wahrscheinlichkeiten.

Wenn es wahrscheinlich ähnlich aussieht wie das Konfidenzintervall, gehen Sie folgendermaßen vor: Berechnen Sie ein Konfidenzintervall von 95%, ein Konfidenzintervall von 90% und ein Konfidenzintervall von 85%. Wir wären zu 5% zuversichtlich, dass der wahre Wert in der Region innerhalb des 95% -Intervalls liegt, aber außerhalb des 90% -Intervalls können wir sagen, dass der wahre Wert mit einer Wahrscheinlichkeit von 5% in diese Region fällt. Gleiches gilt für die Region innerhalb des 90% -Intervalls, jedoch außerhalb des 85% -Intervalls. Wenn also jeder Wert gleich wahrscheinlich ist, müsste die Größe der beiden oben genannten Bereiche exakt gleich sein, und dies gilt auch für den Bereich innerhalb eines Konfidenzintervalls von 10%, jedoch außerhalb eines Konfidenzintervalls von 5%. Keine der Standardverteilungen, mit denen Intervalle erstellt werden, hat diese Eigenschaft (mit Ausnahme von Sonderfällen, bei denen 1 aus einer Uniform stammt).

Sie können dies auch selbst beweisen, indem Sie eine große Anzahl von Datensätzen aus bekannten Populationen simulieren, das interessierende Konfidenzintervall berechnen und dann vergleichen, wie oft der wahre Parameter näher an der Punktschätzung liegt als an jedem der Endpunkte.

— Greg Snow
quelle

3

Wahrscheinlichkeit ist das, was diese Frage in der Antwort benötigt, nicht Wahrscheinlichkeit, entweder häufig oder bayesianisch. Die Wahrscheinlichkeit liefert genau die Antwort, die anderen können dies nur mit etwas Verdrehen und Strecken tun.

— Michael Lew

1

@ Greg Ich mag deine Erklärung. Um klar zu sein, unterstützt Ihr Argument die Annahme, dass die Werte an den "Endpunkten" des 95% -KI weniger wahrscheinlich (weniger wahrscheinlich) sind als diejenigen, die näher an der Punktschätzung liegen, richtig? Vielen Dank für Ihre Antwort.

— pmgjones

1

@pmgjones weniger wahrscheinlich, NEIN, siehe 2. Absatz. Weniger wahrscheinlich im Kontext des 4. Absatzes, ja.

— Greg Snow

2

@GregSnow Ihr 2. Absatz besagt fast genau, dass die Wahrscheinlichkeit, dass der wahre Parameter der wahre Parameter ist, 100% beträgt. Glauben Sie wirklich, dass diese Tautologie das ist, was "strenge frequentistische Definitionen" zu bieten haben?

— Rolando2

2

@ rolando2, ich denke, dass die frequentistische Statistik viel zu bieten hat. Ich habe nur die üblichen Falschangaben beseitigt, die die tatsächlichen Wertänderungen implizieren, und manchmal außerhalb des Intervalls und manchmal innerhalb des Intervalls (und manchmal näher an den Grenzen und manchmal näher an der Grenze) Center). Die späteren Absätze bekommen dann das zutreffendere Gefühl für die Ideen.

— Greg Snow

19

Das ist eine tolle Frage! Es gibt ein mathematisches Konzept namens Likelihood, das Ihnen hilft, die Probleme zu verstehen. Fisher erfand die Wahrscheinlichkeit, hielt sie jedoch für etwas weniger wünschenswert als die Wahrscheinlichkeit, aber die Wahrscheinlichkeit erwies sich als "primitiver" als die Wahrscheinlichkeit, und Ian Hacking (1965) betrachtete sie als axiomatisch, da sie nicht nachweisbar ist. Die Wahrscheinlichkeit untermauert eher die Wahrscheinlichkeit als das Gegenteil.

Hacking, 1965. Logik der statistischen Inferenz .

Der Wahrscheinlichkeit wird nicht die Aufmerksamkeit geschenkt, die sie in Standardlehrbüchern der Statistik haben sollte, und zwar ohne guten Grund. Es unterscheidet sich von der Wahrscheinlichkeit darin, dass es fast genau die Eigenschaften aufweist, die man erwarten würde, und Wahrscheinlichkeitsfunktionen und -intervalle sind sehr nützlich für die Schlussfolgerung. Vielleicht wird die Wahrscheinlichkeit von einigen Statistikern nicht gemocht, weil es manchmal keinen "richtigen" Weg gibt, die relevanten Wahrscheinlichkeitsfunktionen abzuleiten. In vielen Fällen sind die Wahrscheinlichkeitsfunktionen jedoch offensichtlich und klar definiert. Eine Untersuchung der Inferenzwahrscheinlichkeiten sollte wahrscheinlich mit Richard Royalls kleinem und leicht verständlichem Buch " Statistical Evidence: a Likelihood Paradigm" beginnen .

Die Antwort auf Ihre Frage lautet: Nein, die Punkte in einem Intervall haben nicht alle die gleiche Wahrscheinlichkeit. Diejenigen an den Rändern eines Konfidenzintervalls haben gewöhnlich geringere Wahrscheinlichkeiten als andere in Richtung der Mitte des Intervalls. Das herkömmliche Konfidenzintervall sagt natürlich nichts direkt über den für das jeweilige Experiment relevanten Parameter aus. Die Konfidenzintervalle von Neyman sind "global", da sie eher langfristige Eigenschaften aufweisen als "lokale" Eigenschaften, die für das vorliegende Experiment relevant sind. (Glücklicherweise kann eine gute Langzeitleistung auf lokaler Ebene interpretiert werden, dies ist jedoch eher eine intellektuelle Abkürzung als eine mathematische Realität.) Wahrscheinlichkeitsintervalle - in den Fällen, in denen sie konstruiert werden können - spiegeln direkt die Wahrscheinlichkeit wider, mit der das vorliegende Experiment in Beziehung steht.

— Michael Lew
quelle

1

@suncoolsu Es ist nicht erforderlich, dass das fragliche Intervall ein Wahrscheinlichkeitsintervall ist, damit die Aussage wahr ist. Das Intervall muss nur die wahrscheinlichste Schätzung umfassen, damit die Intervallgrenzen jeweils weniger wahrscheinlich sind als ein Punkt innerhalb des Intervalls. Jedes gewöhnliche Konfidenzintervall erfüllt diese Anforderung.

— Michael Lew

2

@pmjones A 95% CI SAGEN SIE NICHT, ob die Werte an den Rändern des CI näher an der Wahrheit liegen als die Werte in der Mitte. CIs machen Aussagen zu wiederholten Stichproben aus der Bevölkerung. Langfristig (dh nach wiederholter Probenahme) decken 95% dieser CIs, die für jede Probe erstellt wurden, den wahren Wert ab. Daher gibt es zwei Schlüsselbemerkungen: 1) Man kann nichts über den wahren Wert für ein gegebenes CI aussagen. 2) CIs sagen nichts über die beobachteten Daten aus, was eine übliche Bayes'sche Kritik ist.

— Suncoolsu

1

@MichaelLew Likelihood Prinzip ist nützlich, aber ich sagte, dass (unter Berufung auf LW) "Tatsächlich verstößt jede frequentistische Inferenz gegen LP. Wenn wir also an LP festhalten, müssten wir die frequentistische Inferenz aufgeben." Da CI eine häufig auftretende Idee ist, verletzt es LP (was Sie für grundlegend halten).

— Suncoolsu

1

@suncollsu Die Frage ist nicht, ob ein Konfidenzintervall allein und ohne andere statistische Überlegungen etwas über die Wahrscheinlichkeit von Parameterwerten in sich aussagt . Es geht um die Wahrscheinlichkeit von Parameterwerten innerhalb des Intervalls. Die Wahrscheinlichkeitsfunktion beantwortet die Frage, und diese Antwort ist auch dann richtig, wenn das Konfidenzintervall das Wahrscheinlichkeitsprinzip verletzt. (Lies meinen vorherigen Kommentar noch einmal. Du scheinst seinen Inhalt völlig ignoriert zu haben.)

— Michael Lew

2

@ rolando2 Die 95% -Konfidenzintervalle von Neyman sind so ausgelegt, dass die Methode in 95% der Fälle, in denen die Methode verwendet wird, den wahren Parameter enthält. Streng genommen hängt das Vertrauen von der Methode ab und nicht von einem einzelnen Intervall. Das einzelne Intervall sagt also nichts über den Zustand der Welt in diesem bestimmten Experiment aus. Siehe meine Antwort auf diese Frage für weitere Details: stats.stackexchange.com/questions/8844/…

— Michael Lew

18

Angenommen, jemand hat mir gesagt, ich sollte allen Werten innerhalb eines CI95 als potenziellen Indikatoren für den Bevölkerungswert gleiches Vertrauen schenken. (Ich vermeide bewusst die Begriffe "wahrscheinlich" und "wahrscheinlich".) Was ist das Besondere an 95? Nichts: Um konsequent zu sein, müsste ich auch allen Werten innerhalb eines CI96, eines CI97, ... und eines CI99.9999999 gleiches Vertrauen schenken. Da sich die Reichweite des CI seinem Limit näherte, müssten praktisch alle reellen Zahlen einbezogen werden. Die Unsinnigkeit dieser Schlussfolgerung würde mich veranlassen, die ursprüngliche Behauptung zurückzuweisen.

— rolando2
quelle

4

Das ist eine großartige Antwort! Ich hätte über die Auswirkung nachdenken sollen, wenn ich mich Extremen möglicher CIs näherte. Vielen Dank für das Schreiben!

— pmgjones

2

Beginnen wir mit der Definition eines Konfidenzintervalls. Wenn ich sage, dass ein Konfidenzintervall von 95% von diesem Intervall bis zu diesem Intervall reicht, meine ich, dass Aussagen dieser Art in 95% der Fälle wahr und in 5% der Fälle falsch sind. Ich meine nicht unbedingt, dass ich zu 95% von dieser Aussage überzeugt bin . Ein Konfidenzintervall von 90% wird enger und ein Konfidenzintervall von 80% noch enger. Wenn ich mich frage, was der wahre Wert ist, habe ich weniger Vertrauen in Werte, wenn sie näher und näher an den Rand eines bestimmten Konfidenzintervalls rücken.

Beachten Sie, dass alles oben Genannte qualitativ ist, insbesondere "Glaubwürdigkeit". (Ich habe den Begriff "Vertrauen" oder "Wahrscheinlichkeit" in dieser Aussage vermieden, weil sie mathematisches Gepäck enthalten, das sich von unserem intuitiven Gepäck unterscheiden kann.) Bayesianische Ansätze würden Ihre Frage auf etwas umformulieren, das eine quantitative Antwort hat, die ich aber nicht öffnen möchte das kann von Würmern hier.

Der klassische Text von Box, Hunter & Hunter ("Statistics for Experimenters", Wiley, 1978) könnte ebenfalls hilfreich sein. Siehe "Sätze von Konfidenzintervallen" auf S. 113 ff.

— Emil Friedman
quelle

Da es sich teilweise um Konzepte und teilweise um Semantik handelt, möchte ich darauf hinweisen, dass Sie in Ihrem zweiten Satz "... Aussagen dieser Art sind wahr ..." gesagt haben, ohne anzugeben, welche Aussagen wahr wären.

— Rolando2