Unterschied zwischen dem Wilcoxon Rank Sum Test und dem Wilcoxon Signed Rank Test


22

Ich habe mich gefragt, was der theoretische Unterschied zwischen dem Wilcoxon-Rank-Summen-Test und dem Wilcoxon-Signed-Rank-Test unter Verwendung von Beobachtungspaaren ist. Ich weiß, dass der Wilcoxon-Rang-Summen-Test eine unterschiedliche Anzahl von Beobachtungen in zwei verschiedenen Stichproben zulässt, während der Signed-Rank-Test für gepaarte Stichproben dies nicht zulässt, obwohl beide meiner Meinung nach gleich zu testen scheinen. Kann mir jemand mehr Hintergrund- / theoretische Informationen geben, wann man den Wilcoxon-Rang-Summen-Test und wann man den Wilcoxon-Signed-Rank-Test mit gepaarten Beobachtungen verwenden sollte?

Antworten:


25

Sie sollten den vorzeichenbehafteten Rangtest verwenden, wenn die Daten gepaart werden .

Es gibt viele Definitionen von Pairing, aber im Grunde ist das Kriterium etwas, das Wertepaare zumindest einigermaßen positiv abhängig macht, während ungepaarte Werte nicht abhängig sind. Oft tritt die Abhängigkeitspaarung auf, weil sie Beobachtungen auf derselben Einheit sind (wiederholte Messungen), aber es muss sich nicht auf derselben Einheit befinden, sondern wird in gewisser Weise in Verbindung gebracht (während die gleiche Art von Dingen gemessen wird). , als "gepaart" zu betrachten.

Sie sollten den Rang-Summen-Test verwenden, wenn die Daten nicht gepaart sind.

Das ist im Grunde alles, was es zu tun gibt.

nn

Die Verwendung eines gepaarten Tests bei gepaarten Daten hat zur Folge, dass im Allgemeinen mehr Leistung zum Erkennen der Änderungen zur Verfügung steht, an denen Sie interessiert sind. Wenn die Zuordnung zu einer starken Abhängigkeit * führt, kann der Leistungsgewinn erheblich sein.

* Genauer gesagt, aber etwas locker ausgedrückt: Wenn die Effektgröße im Vergleich zu der typischen Größe der Paarunterschiede groß ist, aber im Vergleich zu der typischen Größe der ungepaarten Unterschiede klein ist, können Sie die Differenz mit einem gepaarten Test bei a erfassen ziemlich kleine Stichprobengröße, aber mit einem ungepaarten Test nur bei einer viel größeren Stichprobengröße.

Wenn die Daten jedoch nicht gepaart sind, kann es (zumindest geringfügig) kontraproduktiv sein, die Daten als gepaart zu behandeln. Allerdings können die Kosten - bei Stromausfall - unter vielen Umständen recht gering sein - eine Stromstudie, die ich in Beantwortung dieser Frage durchgeführt habe, scheint darauf hinzudeuten, dass der Stromverlust in typischen Situationen mit kleinen Stichproben (z. B. für n der Größenordnung) durchschnittlich ist von 10 bis 30 in jeder Probe kann überraschend klein sein, nachdem Unterschiede im Signifikanzniveau ausgeglichen wurden.

[Wenn Sie sich irgendwie wirklich nicht sicher sind, ob die Daten gepaart sind oder nicht, ist der Verlust bei der Behandlung von ungepaarten Daten als gepaart in der Regel relativ gering, während die Gewinne erheblich sein können, wenn sie gepaart sind. Dies deutet darauf hin, dass es in der Praxis möglicherweise sinnvoll ist, zu handeln, wenn Sie nicht genau wissen, welche Werte mit welchen gepaarten Werten gepaart sind, vorausgesetzt, sie wurden gepaart als ob die Daten sicherheitshalber gepaart wären - obwohl manche Leute dazu neigen, sich ziemlich über Sie zu ärgern, wenn Sie das tun.]


7

Ich bin kein Forscher, aber ein Statistiker. Ich werde zunächst die Anforderungen für den Wilcoxon Signed Rank Sum Test (WSRST) festlegen.

  • Das WSRST verlangt, dass die Populationen gepaart werden, zum Beispiel, dass dieselbe Gruppe von Menschen bei zwei verschiedenen Gelegenheiten oder Dingen getestet und auf die Auswirkungen von jedem gemessen wird und wir dann die beiden Dinge oder Gelegenheiten vergleichen.
  • Das WSRST verlangt, dass die Daten quantitativ sind. Quantitative Daten sind Daten, die entlang einer Skala gemessen werden. Deshalb habe ich die gemessene Welt im ersten Punkt hervorgehoben. Wurden die Teilnehmer gebeten, ihre Antworten zu bewerten, werden Sie sich dann mit qualitativen Daten befassen, wobei Sie dann den Zeichentest verwenden müssen, um Ihre Hypothese zu testen.

[Es gibt andere Anforderungen für das WSRST, aber die, die ich aufgelistet habe, reichen aus, um die beiden Tests zu unterscheiden.]

Jetzt der Wilcoxon Rank Sum Test (WRST)

  • Die Hauptanforderung besteht darin, dass die Proben aus unabhängigen Populationen entnommen werden. Zum Beispiel möchten Sie vielleicht testen, ob das Prüfungsblatt 1 härter ist als das Prüfungsblatt 2, und dazu haben Sie zwei Gruppen von Schülern, und die Gruppen müssen nicht die gleiche Größe haben. Aus dem Beispiel sind die beiden Gruppen unabhängig. Wenn Sie dieselbe Gruppe gebeten haben, dieselbe Arbeit zweimal zu schreiben, verwenden Sie WSRST, um Ihre Hypothese zu testen.
  • Die andere Anforderung ist, dass die Daten nicht quantitativ sein müssen, dh Sie können den Test auch mit qualitativen Daten durchführen.
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.