Das ist eine gute Frage.
Der exakte Test von Fisher ist eines der großartigen Beispiele für die clevere Verwendung des experimentellen Designs durch Fisher , zusammen mit der Konditionierung von Daten (im Grunde Tabellen mit den beobachteten Zeilen- und Randsummen) und seinem Einfallsreichtum beim Auffinden von Wahrscheinlichkeitsverteilungen (obwohl dies nicht das beste Beispiel ist) , ein besseres Beispiel finden Sie hier ). Die Verwendung von Computern zur Berechnung "genauer" p-Werte hat definitiv dazu beigetragen, genaue Antworten zu erhalten.
Es ist jedoch schwierig, die Annahmen von Fischers genauem Test in der Praxis zu rechtfertigen. Denn das sogenannte "Exakte" ergibt sich aus der Tatsache, dass im "Tee-Verkostungs-Experiment" oder im Fall der 2x2-Kontingenztabellen die Zeilensumme und die Spaltensumme, dh die Grenzsummen, konstruktionsbedingt festgelegt sind. Diese Annahme ist in der Praxis selten gerechtfertigt. Nizza Referenzen finden Sie hier .
Der Name "genau" lässt vermuten, dass die von diesem Test angegebenen p-Werte genau sind, was in den meisten Fällen aus diesen Gründen leider nicht korrekt ist
- Wenn die Ränder nicht konstruktiv festgelegt sind (was in der Praxis fast immer vorkommt), sind die p-Werte konservativ.
- Da der Test eine diskrete Wahrscheinlichkeitsverteilung verwendet (insbesondere eine hypergeometrische Verteilung), ist es für bestimmte Grenzwerte unmöglich, die "genauen Nullwahrscheinlichkeiten", dh den p-Wert, zu berechnen.
In den meisten praktischen Fällen sollte die Verwendung eines Likelihood-Ratio-Tests oder Chi-Quadrat-Tests nicht zu sehr unterschiedlichen Antworten (p-Wert) führen als ein genauer Fisher-Test. Ja, wenn die Ränder festgelegt sind, ist der exakte Test von Fisher die bessere Wahl, aber dies wird selten vorkommen. Daher wird für Konsistenzprüfungen immer die Verwendung des Chi-Quadrat-Tests des Wahrscheinlichkeitsverhältnisses empfohlen.
Ähnliche Ideen gelten, wenn der genaue Fisher-Test auf eine beliebige Tabelle verallgemeinert wird, was im Grunde der Berechnung multivariater hypergeometrischer Wahrscheinlichkeiten entspricht. Daher muss man immer versuchen, Chi-Quadrat- und Likelihood-Ratio-Verteilungs-basierte p-Werte zusätzlich zu "exakten" p-Werten zu berechnen.