Entspricht die von wilcox.test () in R ausgegebene W-Statistik der U-Statistik?


22

Ich habe kürzlich über den Mann-Whitney-U-Test gelesen. Es stellt sich heraus, dass Sie einen Wilcoxon-Test durchführen müssen, um diesen Test in R durchzuführen!

Meine Frage: Ist die W-Statistik von wilcox.testin R identisch mit der U-Statistik?

Antworten:


25

Wilcoxon gilt im Allgemeinen als der ursprüngliche Erfinder des Tests *, obwohl der Ansatz von Mann und Whitney ein großer Fortschritt war und die Fälle, für die die Statistik tabellarisch aufgeführt wurde, erweitert wurden. Ich bevorzuge es, den Test als Wilcoxon-Mann-Whitney zu bezeichnen, um beide Beiträge zu erkennen (Mann-Whitney-Wilcoxon ist ebenfalls zu sehen; das macht mir auch nichts aus).

* Das tatsächliche Bild ist jedoch etwas wolkiger, und einige andere Autoren haben zu diesem oder einem früheren Zeitpunkt die gleiche oder eine ähnliche Statistik erstellt oder in einigen Fällen Beiträge geleistet, die in engem Zusammenhang mit dem Test stehen. Zumindest ein Teil des Kredits sollte an eine andere Stelle fließen.

Der Wilcoxon-Test und der Mann-Whitney-U-Test sind insofern gleichwertig (und die Hilfe gibt an, dass dies der Fall ist), als sie immer dieselben Fälle unter denselben Umständen ablehnen. Ihre Teststatistiken unterscheiden sich höchstens durch eine Verschiebung (und in einigen Fällen nur möglicherweise durch einen Vorzeichenwechsel).

Der Wilcoxon-Test ist in der Literatur in mehr als einer Hinsicht definiert (und diese Mehrdeutigkeit geht mehr auf die ursprüngliche Tabelle der Teststatistik zurück als auf einen Moment), weshalb man darauf achten muss, mit welchem ​​Wilcoxon-Test erörtert wird.

Die beiden häufigsten Definitionsformen werden in diesem Beitragspaar erörtert:

Wilcoxon-Rangsummentest in R

Verschiedene Methoden zur Berechnung der Teststatistik für den Wilcoxon-Rangsummentest

Um zu adressieren, was speziell in R passiert:

Die wilcox.testin R verwendete Statistik wird in help ( ?wilcox.test) definiert, und die Frage nach der Beziehung zur Mann-Whitney-U-Statistik wird dort erläutert:

Die Literatur ist sich nicht einig über die Definitionen der Wilcoxon-Rang-Summe und der Mann-Whitney-Tests

Die beiden gebräuchlichsten Definitionen entsprechen der Summe der Ränge der ersten Stichprobe, wobei der Minimalwert subtrahiert wird oder nicht: R subtrahiert und S-PLUS nicht, was einen um m (m + 1) / 2 größeren Wert für a ergibt erste Probe der Größe m. (Es scheint, dass Wilcoxons Originalpapier die nicht angepasste Summe der Ränge verwendet hat, nachfolgende Tabellen jedoch das Minimum abgezogen haben.)

Der Wert von R kann auch als die Anzahl aller Paare berechnet werden, (x[i], y[j])für die y[j]nicht mehr als x[i]die gebräuchlichste Definition des Mann-Whitney-Tests gilt.

Dieser letzte Satz beantwortet den Aspekt Ihrer Frage vollständig - die Version von W, die R * ausgibt, ist auch der Wert von U.

* Die Summe der Ränge in Beispiel 1 abzüglich des kleinsten Wertes, den es annehmen kann (dh minus ).n1(n1+1)2


7

Sowohl der Wilcoxon-Rang-Summen-Test als auch der Mann-Whitney-Test sind die nicht-parametrischen Äquivalente des unabhängigen t-Tests . In einigen Fällen ist die Version von W, die R gibt, auch der Wert von U. Aber nicht in allen Fällen.

Wenn Sie verwenden: wilcox.test(df$var1 ~ df$var2, paired=FALSE)Das angegebene W ist dasselbe wie U. Sie können es also als Mann-Whitney-U-Statistik melden.

Wenn Sie jedoch: verwenden wilcox.test(df$var1 ~ df$var2, paired=TRUE), führen Sie tatsächlich einen von Wilcoxon signierten Rangtest durch. Der von Wilcoxon unterzeichnete Rangtest entspricht dem abhängigen t-Test .

Quelle: "Statistik mit R entdecken" von Andy Field (2013)


1
Es ist eine gute Idee, darauf hinzuweisen, dass es sich bei dem Argument paired=TRUEnicht um den Wilcoxon-Mann-Whitney, sondern um den signierten Rang handelt.
Glen_b -Reinstate Monica

1

Beachten Sie jedoch, dass der Code: wilcox.test(df$var1 ~ df$var2, paired=FALSE)(mit '~')

erzeugt eine andere W-Statistik als: wilcox.test(df$var1, df$var2, paired=FALSE)(mit ',')


Willkommen auf der Site @Tilen. War dies als Antwort auf die Frage des OP, als Kommentar, der das OP oder einen der Beantworter um Klärung bittet, oder als eigene neue Frage gedacht? Bitte verwenden Sie nur das Feld "Ihre Antwort", um Antworten auf die ursprüngliche Frage zu erhalten. Sie können überall kommentieren, wenn Ihr Ruf> 50 ist. Wenn Sie eine neue Frage haben, klicken Sie auf das graue ASK QUESTION Feld oben auf der Seite und stellen Sie sie dort. Wir können Ihnen dann richtig helfen. Da Sie neu hier sind, möchten Sie vielleicht an unserer Tour teilnehmen , die Informationen für neue Benutzer enthält.
gung - Wiedereinsetzung von Monica

Vielen Dank @gung. In der Tat war es eine Art sowohl Antwort als auch Frage, denke ich. Danke für die Tipps. Ich freue mich darauf, ein Teil davon zu sein.
Tilen

"Antworten" dienen nur der direkten Beantwortung der Frage. Können Sie dies bearbeiten, um es zu einer reineren Antwort zu machen?
gung - Wiedereinsetzung von Monica

Das tut mir leid. Ich habe es jetzt bearbeitet. Sieht es jetzt besser aus?
Tilen

1
Keine Notwendigkeit, sich zu entschuldigen. Ich denke, Ihre Antwort ist implizit in dem, was Sie hier angegeben haben, aber die Leute müssen zwischen den Zeilen lesen. Kannst du es explizit machen und alles in einem Bogen zusammenbinden? Ich bin mir jedoch nicht sicher, ob dies richtig ist. Um die Formelversion zu verwenden, benötigen Sie einen Wertevektor und einen Gruppierungsindikator. ZB wilcox.test(values~ind, with(df, stack(var1=var1, var2=var2)), paired=FALSE). Wenn ich das mache, bekomme ich das gleiche in Wbeide Richtungen.
gung - Wiedereinsetzung von Monica
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.