(Zieht Conover [1] aus dem Bücherregal ...)
Diese Idee ist ziemlich alt; es geht zumindest auf van der Waerden (1952/1953) [2] [3] zurück, der einen Test vorschlug, der dem Kruskal Wallis entspricht, dessen Ränge jedoch durch normale Werte ersetzt wurden. (Die Idee, geordnete zufällige Normalwerte anstelle einer Annäherung an ihre Erwartung oder ihren Median zu verwenden, ist vielleicht sogar etwas älter.)
Laut Conover schlagen Fisher und Yates (1957) [4] vor, Beobachtungen durch erwartete normale Werte (dh transformierte Ränge) in einer Vielzahl von Tests zu ersetzen, bei denen Normalität angenommen wird.
Die asymptotische relative Effizienz bei Normal wird 1 sein, was es ziemlich attraktiv klingen lässt ... jedoch ist der Vorteil gegenüber dem Wilcoxon-Mann-Whitney (Leistungsgewinn) - selbst bei Normal - ziemlich gering, und Wenn die Verteilung schwerer als normal ist (z. B. logistisch), kann dies nachteilig sein. (Einige Simulationen deuten darauf hin, dass dies tatsächlich der Fall ist: Wenn die Verteilung nicht bereits nahezu normal ist - in diesem Fall hat die Transformation keinen Vorteil -, kann eine solche Transformation tatsächlich an Leistung verlieren.)
Chernoff & Lehmann [5] berechnen die asymptotische Kraft für eine Vielzahl von Verteilungen; Wo es mindestens einen sehr kurzen Schwanz gibt (wie die Uniform), kann der normale Scores-Test für eine Schichtalternative gegen den Wilcoxon-Mann-Whitney einen viel besseren ARE haben - besser als der T-Test selbst. Ihre Ergebnisse stimmen mit meinen Simulationen für Fälle mit schwerem Schwanz überein.
Beachten Sie, dass im Fall von zwei Stichproben die beiden Stichproben überhaupt nicht normal sind, da der Mittelwertabstand groß wird, während die kombinierte Stichprobe ganz normal aussieht:
Infolgedessen werden nicht alle Eigenschaften des normalen Tests auf den Test mit normalen Bewertungen übertragen, und das Verhalten bei größeren Abständen (mit kleinen Proben) ist möglicherweise nicht intuitiv.
Die Tests, die mit dieser Idee erhalten wurden, werden manchmal zusammen als Normal-Score-Tests bezeichnet , wobei der Suchbegriff (beispielsweise über Google) eine Reihe von Referenzen enthält.
Zum Beispiel diskutiert Richard Darlington hier , dies für den von Wilcoxon unterzeichneten Ränge-Test zu tun. Er weist darauf hin, dass es einen Vorteil gegenüber dem einfachen Rangtest gibt, da dadurch die Anzahl der gebundenen Werte der Teststatistik verringert wird.
Bevor ich Seiten darauf schreibe, überlasse ich es Ihnen, weiter zu suchen.
Conover listet eine Reihe anderer Referenzen auf und hat einiges an Diskussion, daher würde ich definitiv empfehlen, das zu lesen.
Gelmans Argument scheint jedoch die Bequemlichkeit zu sein - nicht jedes Mal, wenn sich die Situation ändert, muss ein neuer Test entwickelt werden; Wenn jedoch Bequemlichkeit das Hauptproblem ist, besteht bereits die Möglichkeit, Permutationstests für jede gewünschte Statistik zu verwenden. [Beim Ansatz mit normalen Punktzahlen besteht die Schwierigkeit darin, dass wir immer noch einen geeigneten Rang benötigen - Sie können nicht einfach Dinge, die nicht vergleichbar sind, unter die Null stellen und das richtige Verhalten erwarten. Es gibt ein ähnliches Problem mit dem Permutationstest, da Sie ebenfalls eine Austauschbarkeit unter Null benötigen.]
Sie erwähnen eine R-Funktion, können sie jedoch in R einfach mit Funktionen, die bereits mit R geliefert werden, ordnen und in normale Werte umwandeln.
sleep
Wenn Sie beispielsweise die Daten in R verwenden, führen Sie einen T-Test folgendermaßen durch:
t.test(extra ~ group, data = sleep) # Welch
t.test(extra ~ group, data = sleep, var.equal=TRUE) # equal-variance
t.test(qqnorm(extra,plot=FALSE)$x ~ group, data = sleep) # normal scores
[1] Conover, WJ (1980),
Practical Nonparameteric Statistics , 2e.
Wiley. S. 316–327.
(Aus dem obigen Wikipedia-Link geht hervor, dass die Diskussion in 3e (1999) auf S. 396 beginnt.)
[2] van der Waerden, BL (1952),
"Ordnungsprüfungen für das Zwei-Stichproben-Problem und ihre Potenz",
Proceedings der Koninklijke Nederlandse Akademie van Wetenschappen , Serie A 55 ( Indagationes Mathematicae 14 ), 453–458.
[3] van der Waerden, BL (1953),
"Ordnungsprüfungen für das Zwei-Stichproben-Problem. II, III",
Verfahren der Koninklijke Nederlandse Akademie van Wetenschappen , Serie A 56 ( Indagationes Mathematicae , 15 ), 303–310 & 311–316.
(Es gibt auch Korrekturen an dem Papier von 1952 auf Seite 80 dieses Bandes.)
[4] Fisher RA und Yates F. (1957)
Statistische Tabellen für die biologische, landwirtschaftliche und medizinische Forschung , 5e, Oliver & Boyd, Edinburgh.
[5] Hodges, JL; Lehmann, EL (1961),
"Vergleich der Normalwerte und Wilcoxon-Tests",
Proceedings of the Fourth Berkeley Symposium on Mathematical Statistics and Probability, Band 1: Beiträge zur Theorie der Statistik , 307-317,
University of California Press, Berkeley, Kalifornien
http://projecteuclid.org/euclid.bsmsp/1200512171 .