Mann-Whitney-Nullhypothese bei ungleicher Varianz


9

Ich bin nur neugierig auf die Nullhypothese eines Mann-Whitney-U-Tests. Ich sehe oft, dass die Nullhypothese lautet, dass zwei Populationen gleiche Verteilungen haben. Aber ich denke - wenn ich zwei normale Populationen mit dem gleichen Mittelwert, aber einer extrem ungleichen Varianz hätte, würde der Mann-Whitney-Test diesen Unterschied wahrscheinlich nicht erkennen.

Ich habe auch gesehen, dass festgestellt wurde, dass die Nullhypothese des Mann-Whitney-Tests oder die Wahrscheinlichkeit, dass eine Beobachtung von einer Population ( X ) eine Beobachtung von der zweiten Population ( Y ) überschreitet (danach) Ausschluss von Bindungen) ist gleich 0,5. Dies scheint etwas sinnvoller zu sein, scheint aber nicht der ersten von mir angegebenen Nullhypothese zu entsprechen.X Y.Pr(X>Y)=0.5XY

Ich hoffe, ein bisschen Hilfe zu bekommen, um das zu entwirren. Vielen Dank!

Antworten:


5

Der Mann-Whitney-Test ist ein Sonderfall eines Permutationstests (die Verteilung unter der Null wird abgeleitet, indem alle möglichen Permutationen der Daten betrachtet werden), und Permutationstests haben die Null als identische Verteilungen, so dass dies technisch korrekt ist.

Eine Denkweise der Mann-Whitney-Teststatistik ist ein Maß dafür, wie oft ein zufällig ausgewählter Wert aus einer Gruppe einen zufällig ausgewählten Wert aus der anderen Gruppe überschreitet. Daher ist auch P (X> Y) = 0,5 sinnvoll, und dies ist technisch eine Eigenschaft der Gleichverteilungen Null (unter der Annahme kontinuierlicher Verteilungen, bei denen die Wahrscheinlichkeit eines Gleichstands 0 ist). Wenn die beiden Verteilungen gleich sind, beträgt die Wahrscheinlichkeit, dass X größer als Y ist, 0,5, da beide aus derselben Verteilung stammen.

Der angegebene Fall von 2 Verteilungen mit demselben Mittelwert, aber stark unterschiedlichen Varianzen stimmt mit der 2. Nullhypothese überein, jedoch nicht mit der 1. identischen Verteilung. Wir können einige Simulationen durchführen, um zu sehen, was in diesem Fall mit den p-Werten passiert (theoretisch sollten sie gleichmäßig verteilt sein):

> out <- replicate( 100000, wilcox.test( rnorm(25, 0, 2), rnorm(25,0,10) )$p.value )
> hist(out)
> mean(out < 0.05)
[1] 0.07991
> prop.test( sum(out<0.05), length(out), p=0.05 )

        1-sample proportions test with continuity correction

data:  sum(out < 0.05) out of length(out), null probability 0.05
X-squared = 1882.756, df = 1, p-value < 2.2e-16
alternative hypothesis: true p is not equal to 0.05
95 percent confidence interval:
 0.07824054 0.08161183
sample estimates:
      p 
0.07991 

Dies wird also eindeutig häufiger abgelehnt als es sollte, und die Nullhypothese ist falsch (dies entspricht der Verteilungsgleichheit, aber nicht prob = 0,5).

Das Denken in Bezug auf die Wahrscheinlichkeit von X> Y stößt auch auf einige interessante Probleme, wenn Sie jemals Populationen vergleichen, die auf Efrons Würfeln basieren .


Hallo Greg, danke für die Antwort. Es hört sich so an, als ob Sie sagen, ich habe einen besonderen Fall gefunden, in dem der Test unter den Nullverteilungen gleich nicht richtig funktioniert. Außerdem sind die von mir angegebenen Nullhypothesen nicht gleich. Ist das korrekt?
Jimj

4

Mann-Whitney reagiert nicht empfindlich auf Varianzänderungen mit gleichem Mittelwert, kann jedoch - wie Sie bei der Form - Unterschiede erkennen, die dazu führen, dass von abweicht (z wo sowohl Mittelwert als auch Varianz zusammen zunehmen). Ganz klar, wenn Sie zwei Normalen mit gleichem Mittelwert hatten, sind ihre Unterschiede symmetrisch um Null. Daher ist , was die Nullsituation ist.P ( X > Y ) 0,5 P ( X > Y ) = P ( X - Y > 0 ) = 1P(X>Y)=0.5P(X>Y)0.5P(X>Y)=P(XY>0)=12

Wenn zum Beispiel die Verteilung von exponentiell mit dem Mittelwert während eine exponentielle Verteilung mit dem Mittelwert (eine Skalenänderung), ist der Mann-Whitney dafür empfindlich (in der Tat, wenn er Protokolle von beiden Seiten nimmt, ist es nur a Ortsverschiebung, und das Mann-Whitney bleibt von der monotonen Transformation unberührt.1 X kY1Xk

- -

Wenn Sie an Tests interessiert sind, die dem Mann-Whitney konzeptionell sehr ähnlich sind und die auf Unterschiede in der Streuung unter Gleichheit der Mediane reagieren , gibt es mehrere solcher Tests.

Es gibt zum Beispiel den Siegel-Tukey- Test und den Ansari-Bradley-Test, die beide eng mit dem Mann-Whitney-Wilcoxon-Test mit zwei Stichproben verwandt sind.

Sie basieren beide auf der Grundidee, von Anfang an einzusteigen.

Wenn Sie R verwenden, ist der Ansari-Bradley-Test in ... ?ansari.test

Der Siegel-Tukey führt tatsächlich nur einen Mann-Whitney-Wilcoxon-Test an Rängen durch, die aus der Stichprobe unterschiedlich berechnet wurden. Wenn Sie die Daten selbst bewerten, benötigen Sie keine separate Funktion für die p-Werte. Trotzdem finden Sie einige, wie hier:

http://www.r-statistics.com/2010/02/siegel-tukey-a-non-parametric-test-for-equality-in-variability-r-code/

- -

(in Bezug auf den Kommentar von ttnphns unter meiner ursprünglichen Antwort)

Sie würden meine Antwort überinterpretieren, um sie als nicht einverstanden mit @GregSnow in einem besonders inhaltlichen Sinne zu lesen. Es gibt sicherlich einen Unterschied in der Betonung und in gewissem Maße in dem, worüber wir sprechen, aber ich wäre sehr überrascht, wenn dahinter wirklich echte Meinungsverschiedenheiten stecken würden.

Lassen Sie uns Zitat Mann und Whitney: „Eine Statistik in Abhängigkeit von den relativen Ränge der 's und ist vorgeschlagen zum Testen der Hypothese . “ Das ist eindeutig; es unterstützt die Position von @ GregSnow voll und ganz.x y f = gUxyf=g

Lassen Sie uns nun sehen, wie die Statistik aufgebaut ist: " Lassen Sie zählen, wie oft ein vor einem .y x Uyx " Wenn nun ihre Null wahr ist, ist die Wahrscheinlichkeit dieses Ereignisses ... aber Es gibt andere Möglichkeiten, eine Wahrscheinlichkeit von 0,5 zu erhalten, und in diesem Sinne könnte man annehmen, dass der Test unter anderen Umständen funktionieren kann. In dem Maße, in dem sie eine (neu skalierte) Wahrscheinlichkeit schätzen, dass > , unterstützt es das, was ich gesagt habe.1 YX.12YX

Damit jedoch garantiert wird, dass die Signifikanzniveaus genau korrekt sind, muss die Verteilung von mit der Nullverteilung übereinstimmen. Dies basiert auf der Annahme, dass alle Permutationen der und Gruppenmarkierungsmarkierungen zu den kombinierten Beobachtungen unter der Null gleich wahrscheinlich waren. Dies ist sicherlich unter der Fall . Genau wie @GregSnow sagte.X Y f = gUXYf=g

Die Frage ist, inwieweit dies der Fall ist (dh dass die Verteilung der Teststatistik mit derjenigen übereinstimmt, die unter der Annahme abgeleitet wurde, dass , oder ungefähr so), für die allgemeiner ausgedrückte Null.f=g

Ich glaube, dass es in vielen Situationen so ist; Insbesondere für Situationen, die allgemeiner sind als die von Ihnen beschriebene (zwei normale Populationen mit demselben Mittelwert, aber extrem ungleicher Varianz können ziemlich stark verallgemeinert werden, ohne die resultierende Verteilung basierend auf den Rängen zu ändern), glaube ich, dass die Verteilung der Teststatistik Es stellt sich heraus, dass es dieselbe Verteilung hat, unter der es abgeleitet wurde, und daher dort gültig sein sollte. Ich habe einige Simulationen durchgeführt, die dies zu unterstützen scheinen. Es wird jedoch nicht immer ein sehr nützlicher Test sein (es kann eine schlechte Leistung haben).

Ich biete keinen Beweis dafür, dass dies der Fall ist. Ich habe einige Intuitions- / Handwellenargumente angewendet und auch einige grundlegende Simulationen durchgeführt, die darauf hindeuten, dass es wahr ist - dass Mann-Whitney (da es die 'richtige' Verteilung unter der Null hat) viel breiter funktioniert als wenn .f=g

Machen Sie daraus, was Sie wollen, aber ich verstehe dies nicht als wesentliche Meinungsverschiedenheit mit @GregSnow

Referenz - Originalpapier von Mann & Whitney


Habe ich Sie richtig verstanden, dass Sie diesen Worten von der Mann-Whitney-Diskussionsseite von Wikipedia zustimmen : the null hypothesis of Mann-Whitney U-test is not about the equality of distributions. Is is about the symmetry between two populations with respect to the probability of obtaining a larger observation. Und so stimmen Sie der Antwort von @ Greg nicht zu, oder?
ttnphns

Ich habe einige Diskussionen in der Bearbeitung hinzugefügt.
Glen_b -State Monica

Sehr schöne Ergänzung. Ich werde es studieren (ich hatte immer das Gefühl, dass es im MW-Test Nuancen gibt, die mir weiterhin entgehen). In der Zwischenzeit werden Sie zustimmen, wenn ich sagen würde: "Da die MW-Teststatistik nur die (Un-) Gleichheit der mittleren Ränge widerspiegelt , kann es Situationen geben, in denen f ~ = g [ich verstehe f, g als ursprüngliche Verteilungen, vorherige Rangfolge], aber Der Test ist dennoch vollständig relevant, da er sich weiterhin mit demselben H0 wie unter f = g befasst. Ein Beispiel für eine solche Situation sind symmetrische Verteilungen, die bis auf den Spread-Parameter (Varianz) vollständig identisch sind . "
ttnphns

In der Notation (Mann und Whitney von der Art und Weise), und sind die Dichten von und . Ich stimme zu, dass Ihre Aussage in dem Maße, in dem ich die Umstände überprüft / verstanden habe, der Fall zu sein scheint. Ich vermute, es gibt immer noch viel an Mann-Whitney, das mir auch entgeht. g X Y.fgXY
Glen_b -State Monica
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.