Beispiel mit 100 Bernoulli-Versuchen
Die Konstruktion von Konfidenzintervallen könnte in einem Diagramm von platziert werden θ gegen θ^ wie hier:
Können wir eine Nullhypothese mit Konfidenzintervallen ablehnen, die durch Stichproben anstelle der Nullhypothese erstellt wurden?
In meiner Antwort auf diese Frage verwende ich die folgende Grafik:
Beachten Sie, dass dieses Bild ein Klassiker und eine Adaption von The Use of Confidence oder Fiducial Limits ist, die im Fall des Binomial CJ Clopper und ES Pearson Biometrika Vol. 2 dargestellt sind. 26, Nr. 4 (Dezember 1934), S. 404-413
Sie könnten eine definieren α-% Vertrauensbereich auf zwei Arten:
in vertikaler Richtung L(θ)<X<U(θ) die Wahrscheinlichkeit für die Daten X, abhängig davon, ob der Parameter wirklich ist θ, innerhalb dieser Grenzen zu fallen ist α .
in horizontaler Richtung L(X)<θ<U(X) Die Wahrscheinlichkeit, dass ein Experiment den wahren Parameter innerhalb des Konfidenzintervalls hat, ist α%.
Korrespondenz zwischen zwei Richtungen
Der entscheidende Punkt ist also, dass zwischen den Intervallen eine Entsprechung bestehtL(X),U(X) und die Intervalle L(θ),U(θ). Hierher kommen die beiden Methoden.
Wann du willst L(X) und U(X)so nah wie möglich sein ( "so schnell wie möglich (1−α) Level Confidence Intervall " ) Dann versuchen Sie, den Bereich der gesamten Region so klein wie möglich zu machen, und dies ähnelt dem AbrufenL(θ) und U(θ)so nah wie möglich. (Mehr oder weniger gibt es keine eindeutige Möglichkeit, das kürzestmögliche Intervall zu erhalten, z. B. können Sie das Intervall für eine Art von Beobachtung verkürzenθ^ auf Kosten einer anderen Art der Beobachtung θ^)
Beispiel mitθ^∼N(μ=θ,σ2=1+θ2/3)
Um die Differenz zwischen dem ersten und dem zweiten Verfahren veranschaulichen wir justieren Sie das Beispiel ein wenig , so dass wir einen Fall, wo die beiden Methoden nicht unterscheiden.
Das nicht konstant, sondern habe eine Beziehung zuσμ=θ θ^∼N(μ=θ,σ2=1+θ2/3)
die Wahrscheinlichkeitsdichtefunktion für die dann , abhängig heißtθ^θf(θ^,θ)=12π(1+θ2/3)−−−−−−−−−−√exp[−(θ−θ^)22(1+θ2/3)]
Stellen Sie sich diese Wahrscheinlichkeitsdichtefunktion die als Funktion von und aufgetragen ist .f(θ^,θ)θθ^
Legende: Die rote Linie ist die obere Grenze für das Konfidenzintervall und die grüne Linie ist die untere Grenze für das Konfidenzintervall. Das Konfidenzintervall wird für (ungefähr 68,3%) gezeichnet . Die dicken schwarzen Linien sind die PDF- (2-fache) und Wahrscheinlichkeitsfunktion, die sich in den Punkten und kreuzen. .±1σ(θ,θ^)=(−3,−1)(θ,θ^)=(0,−1)
PDF In der Richtung von links nach rechts (konstant ) haben wir die pdf für die Beobachtung gegeben . Sie sehen zwei davon projiziert (in der Ebene ). Beachten Sie, dass die Werte-Grenzen ( als Bereich mit der höchsten Dichte ausgewählt) für ein einzelnes PDF auf derselben Höhe liegen, für verschiedene PDF-Dateien jedoch nicht auf derselben Höhe (nach Höhe bedeutet dies den Wert) von )θθ^θθ=7pp<1−αf(θ^,θ)
Likelihood - Funktion in der Richtung von oben nach unten (constant ) haben wir die Likelihood - Funktion für angesichts der Beobachtung . Sie sehen eine davon rechts projiziert.θ^θθ^
Wenn Sie in diesem speziellen Fall die 68% -Masse mit der höchsten Dichte für konstantes auswählen, erhalten Sie nicht das Gleiche wie die Auswahl der 68% -Masse mit der höchsten Wahrscheinlichkeit für konstantes .θθ^
Für andere Prozentsätze des Konfidenzintervalls haben Sie eine oder beide Grenzen bei und das Intervall kann auch aus zwei disjunkten Teilen bestehen. Hier liegt also offensichtlich nicht die höchste Dichte der Wahrscheinlichkeitsfunktion (Methode 2). Dies ist ein eher künstliches Beispiel (obwohl es einfach und schön ist, wie es zu diesen vielen Details führt), aber auch für häufigere Fälle kann man leicht feststellen, dass die beiden Methoden nicht zusammenfallen (siehe das Beispiel hier, in dem das Konfidenzintervall und das glaubwürdige Intervall vorliegen mit einem flachen Prior werden für den Ratenparameter einer Exponentialverteilung verglichen).±∞
Wann sind die beiden Methoden gleich?
Diese Horizontale gegen Vertikale ergibt das gleiche Ergebnis, wenn die Grenzen und , die die Intervalle in der Darstellung vs Isolinien für . Wenn sich die Grenzen überall auf derselben Höhe befinden wie in keiner der beiden Richtungen, können Sie eine Verbesserung vornehmen.ULθθ^f(θ^;θ)
(im Gegensatz dazu: Im Beispiel mit die Konfidenzintervallgrenzen nicht den gleichen Wert für verschiedene , weil die Wahrscheinlichkeitsmasse für größere stärker verteilt wird, also eine geringere Dichte . Dies führt dazu, dass und nicht an der liegen gleicher Wert , zumindest für einige . Dies widerspricht Methode 2, die versucht, die höchsten Dichten für ein gegebenes auszuwählenθ^∼N(θ,1+θ2/3)f(θ^,θ)θ|θ|θlowθhighf(θ^;θ)θ^f(θ^;θ)θ^. Im obigen Bild habe ich versucht, dies zu betonen, indem ich die beiden PDF-Funktionen, die sich auf die Konfidenzintervallgrenzen beziehen, auf den Wert . Sie können sehen, dass sie an diesen Grenzen unterschiedliche Werte des PDF haben.) θ^=−1
Tatsächlich scheint die zweite Methode nicht ganz richtig zu sein (es ist eher eine Art Variante eines Wahrscheinlichkeitsintervalls oder eines glaubwürdigen Intervalls als eines Konfidenzintervalls) und wenn Sie % Dichte in horizontaler Richtung auswählen (Begrenzung % der Masse der Wahrscheinlichkeitsfunktion), dann können Sie von den vorherigen Wahrscheinlichkeiten abhängig sein .αα
Im Beispiel mit der Normalverteilung ist dies kein Problem und die beiden Methoden stimmen überein. Zur Veranschaulichung siehe auch diese Antwort von Christoph Hanck . Dort sind die Grenzen Isolinien. Wenn Sie das ändern, verschiebt sich die Funktion nur und ändert nicht die 'Form'.θf(θ^,θ)
Bezugswahrscheinlichkeit
Das Konfidenzintervall, wenn die Grenzen in vertikaler Richtung erstellt werden, ist unabhängig von den vorherigen Wahrscheinlichkeiten. Dies ist bei der 2. Methode nicht der Fall.
Dieser Unterschied zwischen der ersten und der zweiten Methode kann ein gutes Beispiel für den subtilen Unterschied zwischen Bezugswahrscheinlichkeit und Konfidenzintervallen sein.