Ich bemerkte, dass der kritische Wert mit zunehmenden Freiheitsgraden in einer Tabelle zunimmt . Warum ist das so?
Ich bemerkte, dass der kritische Wert mit zunehmenden Freiheitsgraden in einer Tabelle zunimmt . Warum ist das so?
Antworten:
Folgendes sagt dasselbe:
Für einen gegebenen "Bereich rechts vom kritischen Wert", genannt (griechisch "alpha"), steigt der kritische Wert mit den Freiheitsgraden, genannt (griechisch "nu").
Für einen gegebenen kritischen Wert nimmt mit .
Für jede gegebene Zahl steigt die Wahrscheinlichkeit, dass eine -Variable überschreitet, mit steigendem .
Dies hat eine ziemlich grafische Interpretation. Stellen Sie sich vor, Sie füllen fehlende Spalten für andere Bereiche wie oder . Jede einzelne Zeile - für jede würde eine Beziehung zwischen all diesen Werten von , wie in der oberen Kopfzeile geschrieben, und den Einträgen ausdrücken . Wir können diese Beziehung grafisch darstellen. Es ist üblich, auf die horizontale Achse und auf die vertikale zu setzen. So enthält beispielsweise die oberste Zeile (für ) die zehn Punkte , wie durch die schwarzen Punkte im linken Diagramm gezeigt:
Natürlich muss die ausgefüllte Kurve von der höchstmöglichen Wahrscheinlichkeit von auf den niedrigstmöglichen Wert von abfallen , da es mit zunehmendem kritischen Wert immer weniger wahrscheinlich wird, dass sie überschreitet.
Das Diagramm auf der rechten Seite zeigt alle Werte in der Tabelle, wobei die fehlenden Spalten mit Kurven gefüllt sind. Jede Kurve - eine vollständig ausgefüllte Zeile der Tabelle - fällt von links nach rechts ab. Ihre Formen ändern sich ein wenig und es dauert länger, bis sie nach rechts abfallen. Wenn Sie eine Reihe solcher Kurven haben, die sich verschieben und ihre Form ändern, kreuzen sich normalerweise zwei von ihnen irgendwo. Wenn Sie in diesem Fall jedoch eine Höhe und beobachten, was passiert, wenn zunimmt, werden die Punkte auf den Kurven gleichmäßig nach rechts verschoben: Dies bedeutet, dass die kritischen Werte zunehmen. Die am weitesten links stehenden (grünen) Diagramme müssen daher den kleineren Werten vonNahe der Oberseite des Tisches und die Diagramme auf der rechten Seite verfolgen, was passiert, wenn wächst und wir uns durch den Tisch bewegen. Das Diagramm ganz rechts (grau) zeigt die Werte in der unteren Zeile der Tabelle.
Kurz gesagt, diese komplementären kumulativen Verteilungsfunktionen überschneiden sich nie: zunimmt, verschieben sie sich nach rechts, ohne sich jemals zu kreuzen.
Das ist was passiert. Aber warum ?
Denken Sie daran, dass eine -Verteilung die Summe der Quadrate von unabhängigen Standardnormalvariablen beschreibt. Überlegen Sie, was mit einer solchen Summe von Quadraten passiert
wenn ein weiteres Quadrat, , hinzugefügt wird. Legen Sie einen kritischen Wert und nehmen Sie an, dass eine Chance , überschreiten . Formal,
Dann, weil fast sicher positiv ist,
Dieser Ausdruck zerlegt die Situation, in der in eine (unendliche) Sammlung sich gegenseitig ausschließender Möglichkeiten. Wahrscheinlichkeitsaxiome besagen, dass die Gesamtwahrscheinlichkeit, dass überschreitet , die Summe aller dieser getrennten Wahrscheinlichkeiten sein muss. Ich habe die Summe in zwei Teile geteilt:
Der erste Term auf der rechten Seite ist die Wahrscheinlichkeit, dass bereits überschreitet . In diesem Fall vergrößert das Hinzufügen von nur die Summe.
Der zweite Term rechts (ein Integral) betrachtet alle Möglichkeiten, bei denen nicht überschreitet, aber groß genug ist, um größer als . Es verwendet „ “ , um die Wahrscheinlichkeit darstellt Dichtefunktion (PDF) von . Wenn , ist der zweite Term streng positiv (weil er als die Fläche unter einer Kurve positiver Höhen und positiver horizontaler Ausdehnung von bis interpretiert werden kann ).
Intuitiv bedeutet dies alles, dass das Hinzufügen einer weiteren quadratischen Normalvariablen zu nur die Wahrscheinlichkeit kann, dass die Summe der Quadrate überschreitet . Das ist Aussage (3), die dasselbe ist wie (1), wie in der Frage gestellt.
Erinnern wir uns, was ein Wert ist. Dies ist die Wahrscheinlichkeit, dass ein Wert so weit oder weiter von einem Referenz- / Nullwert entfernt ist wie Ihr beobachteter Wert, wenn die Nullhypothese wahr ist. In Ihrem Fall arbeiten Sie mit , daher ist es die Wahrscheinlichkeit, dass eine beobachtete -Teststatistik so weit oder weiter vom erwarteten Wert entfernt wird, wenn die Nullhypothese wahr ist. Darüber hinaus ist das im Wesentlichen immer ein einseitiger Test (siehe hier ), sodass wir nur an der Wahrscheinlichkeit interessiert sind, einen Wert zu finden, der weit rechts oder weiter rechts innerhalb der Nullverteilung liegt.
Bei einem beobachteten Wert und den relevanten Freiheitsgraden können Sie den Wert direkt berechnen . Aber Sie möchten es nicht mit Stift und Papier versuchen. Heutzutage können Sie solche Werte mit einem Computer und einer Statistiksoftware (wie z. B. ) recht einfach erhalten , aber Tabellen wie die von Ihnen gezeigten waren damals sehr praktisch, als Computer noch nicht weit verbreitet waren. Die Idee war, dass Sie auf einen der oben aufgeführten Werte setzen können ( ist am häufigsten) und den kritischen Wert von entsprechend Ihren Freiheitsgraden nachschlagen können . Dann, wenn dieR
Der Wert Ihrer Analyse war größer als dieser kritische Wert. Sie wussten, dass (obwohl Sie nicht wussten, wie viel weniger / wie hoch der tatsächliche Wert war).
Aus dem Obigen können wir ersehen, dass Ihre Frage lautet: "Warum brauchen wir einen zunehmend höheren beobachteten Wert, um mit zunehmenden Freiheitsgraden im oberen der Verteilung zu sein?"
Die Antwort ist, dass sich die Nullverteilung (genauer gesagt die zentrale) Verteilung ändert, wenn sich die Freiheitsgrade ändern. Sie können dies in @ Hameds hilfreichem Diagramm sehen : Das Quantil (beobachteter Wert), das die oberen, beispielsweise der Verteilung von den unteren trennt, wird größer. Betrachten Sie nur die Verteilungen mit df = 2 und df = 9:
Die Chi-Quadrat-Verteilung mit Freiheitsgraden ist die Summe der Quadrate von unabhängigen (0,1) -Normalverteilungen. Jeder Summand hat einen positiven Erwartungswert, so dass die Chi-Quadrat-Verteilung mit zunehmendem einen immer größeren Mittelwert hat . Darüber hinaus nimmt auch die Standardabweichung zu, und auch die kritischen Werte.
Insbesondere für großes beträgt der Mittelwert der Chi-Quadrat-Verteilung ungefähr und die Standardabweichung ungefähr .
Ich denke, der beste Weg, dies zu verstehen, besteht darin, das Dichtediagramm für verschiedene Freiheitsgrade zu betrachten.
Wenn Sie den folgenden R-Code ausführen,
x = seq(0, 25, length.out=100)
plot(x, dchisq(x=x, df=2), type='l', col=2, ylab='density')
for(i in 3:9){
y = dchisq(x=x, df=i)
lines(x, y, col=i)
}
legend('topright', legend=paste('df = ', 2:9), col=2:9, fill=2:9)
Sie werden diese schöne Handlung bekommen:
Es ist klar, dass mit zunehmendem Freiheitsgrad die Schwänze der Verteilung immer dicker werden. Das zeigt, dass in einem größeren Wert von .