G-Test gegen Pearsons Chi-Quadrat-Test


10

Ich teste die Unabhängigkeit in einer Kontingenztabelle. Ich weiß nicht, ob der G-Test oder der Chi-Quadrat -Test von Pearson besser ist. Die Stichprobengröße liegt bei Hunderten, aber es gibt einige niedrige Zellzahlen. Wie auf der Wikipedia-Seite angegeben , ist die Annäherung an die Chi-Quadrat-Verteilung für den G-Test besser als für den Pearson-Chi-Quadrat-Test. Aber ich verwende die Monte-Carlo-Simulation, um den p-Wert zu berechnen. Gibt es also einen Unterschied zwischen diesen beiden Tests?N×M


Antworten:


8

Sie sind asymptotisch gleich. Es sind nur verschiedene Wege, um zur gleichen Idee zu gelangen. Insbesondere ist der Pearson-Chi-Quadrat-Test ein Score-Test, während der G-Test ein Likelihood-Ratio-Test ist. Um ein besseres Gefühl für diese Ideen zu bekommen, kann es hilfreich sein, meine Antwort hier zu lesen: Warum unterscheiden sich meine p-Werte zwischen der logistischen Regressionsausgabe, dem Chi-Quadrat-Test und dem Konfidenzintervall für den OP? Um Ihre direkte Frage zu beantworten: Wenn Sie den p-Wert durch Monte-Carlo-Simulation berechnen, sollte dies keine Rolle spielen. Sie können einfach das verwenden, was für Sie am bequemsten ist. Beachten Sie, dass es kein Problem mit niedrigen Zellenzahlen gibt, nur (möglicherweise) niedrige erwarteteZellzahlen; Es ist möglich, niedrige Zellzahlen zu haben und erwartete Zählungen zu haben, die in Ordnung sind. Darüber hinaus sind weder niedrige tatsächliche Zählungen noch niedrige erwartete Zählungen von Bedeutung, wenn der p-Wert durch Simulation bestimmt wird.

(Für das, was es wert ist, würde ich wahrscheinlich Pearsons Chi-Quadrat verwenden, da R eine praktische Funktion für das hat, was die Option beinhaltet, den p-Wert zu simulieren.)


Was ist die Funktion in R?
Llewmills

@llewmills , chisq.test.
Gung - Reinstate Monica


0

Chi-Quadrat-Test und G-Test liefern normalerweise ähnliche Ergebnisse. Das Wichtigste dabei ist jedoch, dass Sie einen von zwei Tests auswählen und dabei bleiben, nicht nur für Ihren erwähnten Test, sondern auch für zukünftige Tests im Verlauf Ihrer Forschung. Es ist ratsam, denn wenn Sie versuchen, beide Tests austauschbar zu verwenden, ist es sehr wahrscheinlich, dass Sie die Wahrscheinlichkeit erhöhen, falsch positiv zu werden.


1
Was ist die Begründung, mit der die Behauptung, dass die Wahrscheinlichkeit eines falschen Positivs erhöht wird? (Es sei denn, Sie wollten vorschlagen, dass der Test unter Bezugnahme auf die tatsächlichen Zählungen ausgewählt wird. Dann ist es jedoch die Bezugnahme auf die Zählungen, zwischen denen zu wählen, das Problem und nicht die Idee, Tests per se
möglicherweise auszutauschen.

2
@Glen_b Die Wahrscheinlichkeit, falsch positiv zu werden, steigt wahrscheinlich, wenn wir einen p-Wert des Tests wählen, der für unsere Annahmen günstiger ist (falls wir beide Tests versuchen)
little_monster
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.