Mann-Whitney reagiert nicht empfindlich auf Varianzänderungen mit gleichem Mittelwert, kann jedoch - wie Sie bei der Form - Unterschiede erkennen, die dazu führen, dass von abweicht (z wo sowohl Mittelwert als auch Varianz zusammen zunehmen). Ganz klar, wenn Sie zwei Normalen mit gleichem Mittelwert hatten, sind ihre Unterschiede symmetrisch um Null. Daher ist , was die Nullsituation ist.P ( X > Y ) 0,5 P ( X > Y ) = P ( X - Y > 0 ) = 1P(X>Y)=0.5P(X>Y)0.5P(X>Y)=P(X−Y>0)=12
Wenn zum Beispiel die Verteilung von exponentiell mit dem Mittelwert während eine exponentielle Verteilung mit dem Mittelwert (eine Skalenänderung), ist der Mann-Whitney dafür empfindlich (in der Tat, wenn er Protokolle von beiden Seiten nimmt, ist es nur a Ortsverschiebung, und das Mann-Whitney bleibt von der monotonen Transformation unberührt.1 X kY1Xk
- -
Wenn Sie an Tests interessiert sind, die dem Mann-Whitney konzeptionell sehr ähnlich sind und die auf Unterschiede in der Streuung unter Gleichheit der Mediane reagieren , gibt es mehrere solcher Tests.
Es gibt zum Beispiel den Siegel-Tukey- Test und den Ansari-Bradley-Test, die beide eng mit dem Mann-Whitney-Wilcoxon-Test mit zwei Stichproben verwandt sind.
Sie basieren beide auf der Grundidee, von Anfang an einzusteigen.
Wenn Sie R verwenden, ist der Ansari-Bradley-Test in ... ?ansari.test
Der Siegel-Tukey führt tatsächlich nur einen Mann-Whitney-Wilcoxon-Test an Rängen durch, die aus der Stichprobe unterschiedlich berechnet wurden. Wenn Sie die Daten selbst bewerten, benötigen Sie keine separate Funktion für die p-Werte. Trotzdem finden Sie einige, wie hier:
http://www.r-statistics.com/2010/02/siegel-tukey-a-non-parametric-test-for-equality-in-variability-r-code/
- -
(in Bezug auf den Kommentar von ttnphns unter meiner ursprünglichen Antwort)
Sie würden meine Antwort überinterpretieren, um sie als nicht einverstanden mit @GregSnow in einem besonders inhaltlichen Sinne zu lesen. Es gibt sicherlich einen Unterschied in der Betonung und in gewissem Maße in dem, worüber wir sprechen, aber ich wäre sehr überrascht, wenn dahinter wirklich echte Meinungsverschiedenheiten stecken würden.
Lassen Sie uns Zitat Mann und Whitney: „Eine Statistik in Abhängigkeit von den relativen Ränge der 's und ist vorgeschlagen zum Testen der Hypothese . “ Das ist eindeutig; es unterstützt die Position von @ GregSnow voll und ganz.x y f = gUxyf=g
Lassen Sie uns nun sehen, wie die Statistik aufgebaut ist: " Lassen Sie zählen, wie oft ein vor einem .y x Uyx " Wenn nun ihre Null wahr ist, ist die Wahrscheinlichkeit dieses Ereignisses ... aber Es gibt andere Möglichkeiten, eine Wahrscheinlichkeit von 0,5 zu erhalten, und in diesem Sinne könnte man annehmen, dass der Test unter anderen Umständen funktionieren kann. In dem Maße, in dem sie eine (neu skalierte) Wahrscheinlichkeit schätzen, dass > , unterstützt es das, was ich gesagt habe.1 YX.12YX
Damit jedoch garantiert wird, dass die Signifikanzniveaus genau korrekt sind, muss die Verteilung von mit der Nullverteilung übereinstimmen. Dies basiert auf der Annahme, dass alle Permutationen der und Gruppenmarkierungsmarkierungen zu den kombinierten Beobachtungen unter der Null gleich wahrscheinlich waren. Dies ist sicherlich unter der Fall . Genau wie @GregSnow sagte.X Y f = gUXYf=g
Die Frage ist, inwieweit dies der Fall ist (dh dass die Verteilung der Teststatistik mit derjenigen übereinstimmt, die unter der Annahme abgeleitet wurde, dass , oder ungefähr so), für die allgemeiner ausgedrückte Null.f=g
Ich glaube, dass es in vielen Situationen so ist; Insbesondere für Situationen, die allgemeiner sind als die von Ihnen beschriebene (zwei normale Populationen mit demselben Mittelwert, aber extrem ungleicher Varianz können ziemlich stark verallgemeinert werden, ohne die resultierende Verteilung basierend auf den Rängen zu ändern), glaube ich, dass die Verteilung der Teststatistik Es stellt sich heraus, dass es dieselbe Verteilung hat, unter der es abgeleitet wurde, und daher dort gültig sein sollte. Ich habe einige Simulationen durchgeführt, die dies zu unterstützen scheinen. Es wird jedoch nicht immer ein sehr nützlicher Test sein (es kann eine schlechte Leistung haben).
Ich biete keinen Beweis dafür, dass dies der Fall ist. Ich habe einige Intuitions- / Handwellenargumente angewendet und auch einige grundlegende Simulationen durchgeführt, die darauf hindeuten, dass es wahr ist - dass Mann-Whitney (da es die 'richtige' Verteilung unter der Null hat) viel breiter funktioniert als wenn .f=g
Machen Sie daraus, was Sie wollen, aber ich verstehe dies nicht als wesentliche Meinungsverschiedenheit mit @GregSnow
Referenz - Originalpapier von Mann & Whitney