Ich habe ein Experiment durchgeführt, bei dem ich Messungen von mehreren Teilnehmern gesammelt habe. Jeder relevante Datenpunkt hat zwei Variablen, beide kategorisch: Tatsächlich hat jede Variable zwei mögliche Werte (Antworten auf zwei Ja / Nein-Fragen). Ich möchte einen statistischen Hypothesentest, um zu überprüfen, ob eine Korrelation zwischen diesen beiden Variablen besteht.
Wenn ich einen Datenpunkt pro Teilnehmer hätte, könnte ich den genauen Fisher-Test für die resultierende Kontingenztabelle verwenden. Ich habe jedoch mehrere Datenpunkte pro Teilnehmer. Folglich scheint der genaue Test von Fisher nicht anwendbar zu sein, da die Datenpunkte eines einzelnen Teilnehmers nicht unabhängig sind. Wenn ich zum Beispiel 10 Datenpunkte von Alice habe, sind diese wahrscheinlich nicht unabhängig, weil sie alle von derselben Person stammen. Der genaue Test von Fisher setzt voraus, dass alle Datenpunkte unabhängig voneinander abgetastet wurden, sodass die Annahmen des genauen Tests von Fisher nicht erfüllt sind und eine Verwendung in dieser Einstellung unangemessen wäre (dies könnte zu ungerechtfertigten Berichten von statistischer Signifikanz führen).
Gibt es Techniken, um mit dieser Situation umzugehen?
Ansätze, die ich in Betracht gezogen habe:
Eine plausible Alternative besteht darin, alle Daten jedes Teilnehmers zu einer einzigen Zahl zusammenzufassen und dann einen anderen Unabhängigkeitstest durchzuführen. Zum Beispiel könnte ich für jeden Teilnehmer den Bruchteil der Ja-Antworten auf die erste Frage und den Bruchteil der Ja-Antworten auf die zweite Frage zählen, wobei ich zwei reelle Zahlen pro Teilnehmer erhalten würde, und dann den Produkt-Moment-Test von Pearson verwenden, um die Korrelation zu testen zwischen diesen beiden Zahlen. Ich bin mir jedoch nicht sicher, ob dies ein guter Ansatz ist. (Ich mache mir zum Beispiel Sorgen, dass durch Mittelwertbildung / Zählung Daten weggeworfen werden und dies aufgrund der Aggregation an Leistung verlieren könnte oder dass Anzeichen von Abhängigkeit nach der Aggregation verschwinden könnten.)
Ich habe über mehrstufige Modelle gelesen, die so klingen, als ob sie diese Situation bewältigen sollen, wenn die zugrunde liegenden Variablen stetig sind (z. B. reelle Zahlen) und wenn ein lineares Modell geeignet ist. Hier habe ich jedoch zwei kategoriale Variablen (Antworten auf Ja / Nein-Fragen), sodass sie hier nicht zutreffen. Gibt es eine äquivalente Technik, die auf kategoriale Daten anwendbar ist?
Ich habe auch ein kleines bisschen über das Design wiederholter Messungen in Wikipedia gelesen , aber der Wikipedia-Artikel konzentriert sich auf Längsschnittstudien. Das scheint hier nicht zutreffend zu sein: Wenn ich es richtig verstehe, scheinen sich wiederholte Messungen auf Effekte aufgrund des Zeitablaufs zu konzentrieren (wobei der Verlauf der Zeit die Variablen beeinflusst). In meinem Fall sollte der Zeitablauf jedoch keine relevanten Auswirkungen haben. Sagen Sie mir, wenn ich falsch verstanden habe.
Ein weiterer Ansatz, der mir bei weiteren Überlegungen einfällt, ist die Verwendung eines Permutationstests. Für jeden Teilnehmer könnten wir ihre Antworten auf Frage 1 zufällig permutieren und (unabhängig) zufällig ihre Antworten auf Frage 2 permutieren, wobei für jeden Teilnehmer eine andere Permutation verwendet wird. Mir ist jedoch nicht klar, welche Teststatistik hier angemessen wäre, um zu messen, welche Ergebnisse "mindestens so extrem" sind wie das beobachtete Ergebnis.
Verwandte Themen : Wie werden mehrere Datenpunkte pro Proband korrekt behandelt (dies konzentriert sich jedoch auch auf lineare Modelle für kontinuierliche Variablen, nicht auf kategoriale Daten). Werden Messungen an demselben Patienten unabhängig durchgeführt? (gleich)