Angenommen, ich habe drei Populationen mit vier sich gegenseitig ausschließenden Merkmalen. Ich nehme Zufallsstichproben aus jeder Population und erstelle eine Kreuztabelle oder Häufigkeitstabelle für die von mir gemessenen Merkmale. Habe ich recht, wenn ich sage:
Wenn ich testen möchte, ob eine Beziehung zwischen den Populationen und den Merkmalen besteht (z. B. ob eine Population eine höhere Häufigkeit eines der Merkmale aufweist), sollte ich einen Chi-Quadrat-Test durchführen und prüfen, ob das Ergebnis signifikant ist.
Wenn der Chi-Quadrat-Test signifikant ist, zeigt er mir nur, dass es eine gewisse Beziehung zwischen den Populationen und Merkmalen gibt, aber nicht, wie sie zusammenhängen.
Darüber hinaus müssen nicht alle Merkmale mit der Bevölkerung in Zusammenhang stehen. Wenn beispielsweise die verschiedenen Populationen signifikant unterschiedliche Verteilungen der Merkmale A und B aufweisen, jedoch nicht von C und D, ist der Chi-Quadrat-Test möglicherweise immer noch signifikant.
Wenn ich messen möchte, ob ein bestimmtes Merkmal von der Grundgesamtheit betroffen ist oder nicht, kann ich einen Test zu gleichen Anteilen (ich habe dies als Z-Test oder wie
prop.test()
in bezeichnetR
) nur für dieses Merkmal durchführen.
Mit anderen Worten, ist es angemessen, das zu verwenden prop.test()
, um die Art einer Beziehung zwischen zwei Gruppen von Kategorien genauer zu bestimmen, wenn der Chi-Quadrat-Test angibt, dass eine signifikante Beziehung besteht?