Ich versuche, einen dieser beiden Tests auszuwählen, um gepaarte Daten zu analysieren. Kennt jemand Faustregeln, welche im Allgemeinen zu wählen sind?
Ich versuche, einen dieser beiden Tests auszuwählen, um gepaarte Daten zu analysieren. Kennt jemand Faustregeln, welche im Allgemeinen zu wählen sind?
Antworten:
Ich versuche, einen dieser beiden Tests auszuwählen, um gepaarte Daten zu analysieren. Kennt jemand Faustregeln, welche im Allgemeinen zu wählen sind?
Der vorzeichenbehaftete Rangtest geht von einer Annahme über die Symmetrie der Unterschiede unter der Null aus , die der Vorzeichentest nicht benötigt. (Diese Annahme ist notwendig, damit die Permutationen der Zeichen, die mit den vorzeichenlosen Unterschiedsreihen verbunden sind, gleich wahrscheinlich sind.)
Auf der anderen Seite sollte der signierte Rang mehr Macht haben, wenn die Population nahezu symmetrisch ist und der Schwanz nicht sehr schwer ist.
[Dies sollte nicht als Ratschlag verstanden werden, anhand der Stichprobe zwischen ihnen zu wählen . Im Allgemeinen führt dies zu Testeigenschaften, die vom Nennwert abweichen (Tests können verzerrt sein, die tatsächlichen Signifikanzniveaus entsprechen nicht mehr dem, was sie zu sein scheinen, berechnete p-Werte stellen keine echten p-Werte dar usw.). Stattdessen sollten die Merkmale nach Möglichkeit auf der Grundlage des Wissens außerhalb der Stichprobe bewertet werden, auf die der Test angewendet wird - sei es nach Fachkenntnissen, Vertrautheit mit anderen Datensätzen wie diesem, Aufteilung der Stichproben, ...]
In meinem Fall hat der Rangsummentest den größten p-Wert, der Vorzeichentest ist das Medium, der vorzeichenbehaftete Rang ist der kleinste. Daher hat es mehr Leistung.
Auf diese Weise entscheiden Sie nicht, dass ein Test mehr Leistung hat - ein niedrigerer p-Wert in Bezug auf eine Stichprobe kann einfach auf die Abweichungen dieser Stichprobe zurückzuführen sein, während es bei der Leistung um das Verhalten aller Zufallsstichproben geht, die aus derselben Population stammen.
Stellen Sie sich vor, Sie haben es mit einer bestimmten Situation zu tun, in der die Population der Paardifferenzen etwas von 0 entfernt zentriert ist (dh, dass auf eine bestimmte Weise falsch ist). Bei wiederholter Probenahme unter denselben Bedingungen (einschließlich Stichprobengröße) ist die Leistung die Ablehnungsrate für diese bestimmte Population.
In ähnlicher Weise könnten wir die Abstoßungsrate für eine Folge von Populationen mit unterschiedlicher Position * von Paardifferenzen berechnen und eine gesamte Leistungskurve erhalten. Dann würde "höhere Leistung" der gesamten Leistungskurve (oder fast der gesamten, wobei zu beachten ist, dass beide das gleiche Signifikanzniveau haben sollten) für einen übereinander liegenden Test entsprechen.
* Sie könnten es als Median für die vorliegende Diskussion betrachten - während der Schätzer für den vorzeichenbehafteten Rangtest der Median der paarweisen Mittelwerte der Paardifferenzen ist, sollte der Standortschätzer unter der Symmetrieannahme auch eine geeignete Schätzung des Medianpaars sein Unterschied.
Hier ist eine verwandte Frage, wie man zwischen t-Test oder nicht-parametrischem Test wählt, z. B. Wilcoxon in kleinen Proben . Eine der Antworten beinhaltet eine (kurze) Diskussion der vorliegenden Ausgabe.