Können wir eine Nullhypothese mit Konfidenzintervallen, die durch Stichproben erstellt wurden, anstelle der Nullhypothese ablehnen?

9

Mir wurde beigebracht, dass wir nach Stichproben aus einer Population eine Parameterschätzung in Form eines Konfidenzintervalls erstellen können. Zum Beispiel sollten 95% -Konfidenzintervalle ohne verletzte Annahmen eine Erfolgsrate von 95% aufweisen, wenn sie den wahren Parameter enthalten, den wir in der Grundgesamtheit schätzen.

Dh

Erstellen Sie eine Punktschätzung aus einer Stichprobe.
Erstellen Sie einen Wertebereich, der theoretisch eine Wahrscheinlichkeit von 95% hat, den wahren Wert zu enthalten, den wir zu schätzen versuchen.

Wenn sich das Thema jedoch dem Testen von Hypothesen zugewandt hat, wurden die Schritte wie folgt beschrieben:

Nehmen Sie einen Parameter als Nullhypothese an.
Erstellen Sie eine Wahrscheinlichkeitsverteilung der Wahrscheinlichkeit, verschiedene Punktschätzungen zu erhalten, wenn diese Nullhypothese wahr ist.
Lehnen Sie die Nullhypothese ab, wenn die Punktschätzung, die wir erhalten, in weniger als 5% der Fälle erstellt wird, wenn die Nullhypothese wahr ist.

Meine Frage lautet:

Ist es notwendig, unsere Konfidenzintervalle unter Verwendung der Nullhypothese zu erstellen, um die Null abzulehnen? Warum nicht einfach das erste Verfahren durchführen und unsere Schätzung für den wahren Parameter erhalten (ohne explizit unseren hypothetischen Wert bei der Berechnung des Konfidenzintervalls zu verwenden) und dann die Nullhypothese ablehnen, wenn sie nicht in dieses Intervall fällt?

Dies scheint mir intuitiv logisch gleichwertig zu sein, aber ich befürchte, dass mir etwas sehr Grundlegendes fehlt, da es wahrscheinlich einen Grund gibt, warum es so gelehrt wird.

— Nikli
quelle

Ich entschuldige mich dafür, dass ich unklar bin, Martijn. Ich werde meinen Beitrag in Kürze bearbeiten, damit es für Leute, die in Zukunft dieselben Fragen stellen, klarer wird. Was ich damit gemeint habe ist, dass wir eine Parameterschätzung aus einer Stichprobe berechnen können, oder wir können einen Bereich von Schätzungen berechnen, von denen wir glauben, dass sie die Nullhypothese unter Verwendung der Nullhypothese unterstützen. Ich habe nicht verstanden, warum es notwendig ist, die Null zu verwenden, um zu sehen, ob unsere Punktschätzung in diesem Intervall liegt, anstatt einfach unsere Parameterschätzung zu verwenden und zu überprüfen, ob die Null innerhalb der Grenzen der Parameterschätzung liegt. Ich hoffe das ergibt Sinn!

— Nikli

Ein interessantes Gedankenexperiment ist, wenn jemand versucht, Ihnen gewichtete Würfel zu verkaufen. Sie rollen sie und geben dann an, dass sie in der von Ihnen beobachteten Richtung gewichtet sind (z. B. 6 kommen in 20% der Fälle vor). Sind sie gewichtet (wurden genug Probenwürfe gemacht), um wie viel und was ist es wert, eigene (zusätzliche) Würfeltests durchzuführen? Der Verkäufer und der Käufer haben unterschiedliche Ziele ...

— Philip Oakley

5

Ein einfaches Problem ist beispielsweise das Testen des Mittelwerts einer normalen Population mit bekannter Varianz . Dann ist ein Drehpunkt - eine Größe, deren Verteilung nicht vom Parameter abhängt - gegeben durch . Kritische Werte erfüllen in diesem symmetrischen Fall und . $\sigma^2=1$ $\bar{Y}-\mu\sim N(0,1/n)$ $z_{\alpha/2}$ $\Phi(-z_{\alpha/2})=\alpha/2$ $\Phi(z_{\alpha/2})=1-\alpha/2$

Daher so dass ist ein Konfidenzintervall der Stufe .

\begin{array}{rcl} 1 - α & = & Pr {(\bar{X} - μ) / (1 / \sqrt{n}) \in (- z_{α / 2}, z_{α / 2})} \\ = & Pr {- z_{α / 2} ⩽ (\bar{X} - μ) \sqrt{n} ⩽ z_{α / 2}} \\ = & Pr {z_{α / 2} ⩾ (μ - \bar{X}) \sqrt{n} ⩾ - z_{α / 2}} \\ = & Pr {- z_{α / 2} / \sqrt{n} ⩽ μ - \bar{X} ⩽ z_{α / 2} / \sqrt{n}} \\ = & Pr {\bar{X} - z_{α / 2} / \sqrt{n} ⩽ μ ⩽ \bar{X} + z_{α / 2} / \sqrt{n}} \\ = & Pr {(\bar{X} - z_{α / 2} / \sqrt{n}, \bar{X} + z_{α / 2} / \sqrt{n}) ∋ μ} \end{array}

$\begin{eqnarray*} 1-\alpha&=&\Pr\{(\bar{X}-\mu)/(1/\sqrt{n})\in(-z_{\alpha/2},z_{\alpha/2})\}\\ &=&\Pr\{-z_{\alpha/2}\leqslant(\bar{X}-\mu)\sqrt{n}\leqslant z_{\alpha/2}\}\\ &=&\Pr\{z_{\alpha/2}\geqslant(\mu-\bar{X})\sqrt{n}\geqslant -z_{\alpha/2}\}\\ &=&\Pr\{-z_{\alpha/2}/\sqrt{n}\leqslant\mu-\bar{X}\leqslant z_{\alpha/2}/\sqrt{n}\}\\ &=&\Pr\{\bar{X}-z_{\alpha/2}/\sqrt{n}\leqslant\mu\leqslant \bar{X}+z_{\alpha/2}/\sqrt{n}\}\\ &=&\Pr\{(\bar{X}-z_{\alpha/2}/\sqrt{n},\bar{X}+z_{\alpha/2}/\sqrt{n})\ni\mu\} \end{eqnarray*}$

(\bar{X} - z_{α / 2} / \sqrt{n}, \bar{X} + z_{α / 2} / \sqrt{n})

$(\bar{X}-z_{\alpha/2}/\sqrt{n},\bar{X}+z_{\alpha/2}/\sqrt{n})$

1 - α

$1-\alpha$

Gleichzeitig ist das Ereignis in der ersten Zeile der Anzeige genau auch das Ereignis, dass die Nullhypothese für dieses nicht verworfen wird . Da der Rest nur äquivalente Umformulierungen enthält, enthält das ci tatsächlich alle für die die Null nicht zurückgewiesen wird, und es wird kein Verweis auf "unter der Null" benötigt. $\mu$ $\mu$

Hier ist eine Darstellung analog zu Martijns +1-Visualisierung, die zeigen soll, was als Dualität zwischen Konfidenzintervallen und Tests bekannt ist. bezeichnet das Konfidenzintervall, das zu einem und den Akzeptanzbereich, der zu einer Hypothese . $C$ $\bar{x}^*$ $A(\mu_0)$ $\mu=\mu_0$

— Christoph Hanck
quelle

10

Ja, Sie können einen Hypothesentest (Vergleich der Stichprobe mit einer hypothetischen Verteilung der Testergebnisse) durch einen Vergleich mit einem aus der Stichprobe berechneten Konfidenzintervall ersetzen. Indirekt ist ein Konfidenzintervall jedoch bereits eine Art Hypothesentest, nämlich:

Möglicherweise werden die Konfidenzintervalle als Wertebereich konstruiert, für den ein Hypothesentest auf Ebene erfolgreich sein würde, $\alpha$ und außerhalb des Bereichs würde ein Hypothesentest auf Ebene fehlschlagen. $\alpha$

Die Folge einer solchen Bereich zu machen , ist , dass der Bereich nicht nur einen Bruch der Zeit. $\alpha$

Beispiel

Ich verwende ein Bild aus einer Antwort auf die folgende Frage: Konfidenzintervalle: Wie ich formal mit $P(L(\textbf{X}) \leq \theta, U(\textbf{X})\geq\theta) = 1-\alpha$

Es ist eine Variation eines Diagramms von Clopper-Pearson . Stellen Sie sich den Fall von 100 Bernoulli-Versuchen vor, bei denen die Erfolgswahrscheinlichkeit beträgt und wir die Gesamtzahl der Erfolge . $\theta$ $X$

Beachten Sie, dass:

In vertikaler Richtung sehen Sie Hypothesentests. Beispielsweise lehnen Sie für einen bestimmten hypothetischen Wert die Hypothese ab, wenn das gemessene über oder unter den rot oder grün gepunkteten Linien liegt. $\theta$ $X$
In horizontaler Richtung sehen Sie Clopper-Pearson-Konfidenzintervalle. Wenn Sie für eine bestimmte Beobachtung X diese Konfidenzintervalle verwenden, liegen Sie nur in 5% der Fälle falsch

(weil Sie nur 5% der Zeit ein solches X beobachten, auf das Sie ein "falsches" Intervall stützen)

— Sextus Empiricus
quelle