Ich möchte die Verwendung der Monte-Carlo-Simulation in der chisq.test()
Funktion in R verstehen .
Ich habe eine qualitative Variable mit 128 Stufen / Klassen. Meine Stichprobengröße beträgt 26 (ich konnte nicht mehr "Einzelpersonen" befragen). Also werde ich natürlich einige Level mit 0 "Individuen" haben. Tatsache ist jedoch, dass ich nur eine sehr kleine Anzahl von Klassen von 127 möglichen vertreten habe. Da ich gehört habe, dass wir für die Anwendung des Chi-Quadrat-Tests mindestens 5 Personen in jeder Ebene haben sollten (ich verstehe den Grund dafür nicht vollständig), dachte ich, ich müsste die simulate.p.value
Option verwenden, um die Monte-Carlo-Simulation zur Schätzung der Verteilung zu verwenden und berechne einen p-Wert. Ohne Monte-Carlo-Simulation gibt R einen p-Wert < 1e-16
. Mit der Monte-Carlo-Simulation erhält ich einen p-Wert bei 4e-5
.
Ich habe versucht, den p-Wert mit einem Vektor von 26 Einsen und 101 Nullen zu berechnen, und mit der Monte-Carlo-Simulation erhalte ich einen p-Wert bei 1.
Ist es in Ordnung zu behaupten, dass selbst wenn meine Stichprobengröße im Vergleich zur Anzahl möglicher Klassen klein ist, die beobachtete Verteilung so ist, dass es sehr unwahrscheinlich ist, dass alle möglichen Klassen mit der gleichen Wahrscheinlichkeit (1/127) in der realen Bevölkerung existieren ?