So funktioniert der Pearson's Chi Squared Test

Nach einer kürzlichen Abstimmung habe ich versucht, mein Verständnis des Pearson Chi Squared-Tests zu überprüfen. Normalerweise verwende ich die Chi-Quadrat-Statistik (oder die reduzierte Chi-Quadrat-Statistik) zum Anpassen oder Überprüfen der resultierenden Passform. In diesem Fall entspricht die Varianz normalerweise nicht der erwarteten Anzahl von Zählungen in einer Tabelle oder einem Histogramm, sondern einer experimentell bestimmten Varianz. So oder so hatte ich immer den Eindruck, dass der Test immer noch die asymptotische Normalität des multinomialen PDFs verwendete (dh meine Teststatistik ist

Q. = (n - N m)^{⊤} V^{- 1} (n - N m)

$Q = (n-Nm)^\top V^{-1}(n-Nm)$

und ist asymptotisch multinormal, wobei eine Kovarianzmatrix ist. Daher hat eine Chi-Quadrat-Verteilung mit einem großen sodass die Verwendung der erwarteten Anzahl von Zählungen als Nenner in der Statistik für ein großes gültig wird . Es ist möglich, dass dies nur für Histogramme zutrifft. Ich habe seit Jahren keine kleine Datentabelle mehr analysiert. $(n-Nm)$ $V$ $Q$ $n$ $n$

Gibt es ein subtileres Argument, das mir fehlt? Mich würde eine Referenz interessieren, oder noch besser eine kurze Erklärung. (Obwohl es möglich ist, wurde ich gerade dafür gestimmt, das Wort asymptotisch wegzulassen, was meiner Meinung nach ziemlich wichtig ist.)

chi-squared histogram

— Bowler
quelle

Daraus folgt vermutlich auch, dass man mit allen normal verteilten Daten genau den gleichen Test durchführen kann. Wenn ich ein Voltmeter verwenden würde, von dem ich wusste, dass es einen von mir bestimmten normalverteilten Fehler enthält, könnte ich Folgendes verwenden: . Ist das wahr? Die reduzierte Chi-Quadrat-Statistik beruht vermutlich auf dieser Tatsache.

χ^{2} = \sum_{ich} \frac{(V_{Ö b s} - V_{e x p})^{2}}{σ^{2}}

$\chi^{2} = \sum_{i} \frac{(V_{obs} - V_{exp})^{2}}{\sigma^{2}}$

— Bowler

Ein Chi-Quadrat-Test dient zur Analyse kategorialer Daten. Das bedeutet, dass die Daten gezählt und in Kategorien unterteilt wurden. Es funktioniert nicht mit parametrischen oder kontinuierlichen Daten. Es funktioniert also nicht in jedem Fall, die resultierende Passform zu bestimmen.

Quelle: http://www.ling.upenn.edu/~clight/chisquared.htm

— BradHanks
quelle

Willkommen auf dieser Seite! Ich bin mir nicht sicher, wie dies mit der vorliegenden Frage zusammenhängt. Würde es Ihnen etwas ausmachen, diese Antwort ein wenig zu erweitern, wenn Sie bedenken, dass es in diesem Thread wahrscheinlich mehr um die Prüfung der Anpassungsgüte als um die Analyse von Zwei-Wege-Kontingenztabellen geht?

— chl

Möglicherweise habe ich die Frage falsch verstanden, aber ich habe mich gefragt, ob der Chi-Quadrat-Test in diesem Beispiel angemessen ist. Ich könnte ein bisschen rostig sein ...

— BradHanks

χ^{2}

$\chi^2$

χ^{2}

$\chi^2$