Da Sie über die Stichprobenmittel verfügen und Ihre Hypothese sich auf Populationsmittel bezieht, habe ich angenommen, dass Sie die Stichprobenmittel im Folgenden definitiv verwenden möchten.
Mit einigen Verteilungsannahmen können Sie sicherlich irgendwohin gelangen.
Wenn die Stichprobengröße ziemlich groß ist, können Sie eine Verteilung annehmen, um die IQRs auf eine Schätzung von zu skalieren und sie einfach als Z-Test zu behandeln. (n = 30 ist allerdings nicht wirklich "groß")σ
Wenn Sie beispielsweise von Normalität ausgehen, beträgt der Populationsinterquartilbereich etwa 1,35 . Wenn die Stichprobe also groß genug ist, dass der IQR der Population mit geringem Fehler geschätzt wird, können Sie σ schätzen und einen effektiven Test bei Normal durchführen.σσ
Wenn Sie in diesem Fall nicht gleiche Varianzen annehmen, erhalten Sie , berechnen dann ˜ σ 2 D = ˜ σ 2 1 / n 1 + ˜ σ 2 2 / n 2 und nehmen dann z ∗ = ˉ x 1 - ˉ x 2σich~= IQRich/ 1,35σ~2D.= σ~21/ n1+ σ~22/ n2und Z-Tabellen nachschlagen.z∗= x¯1- x¯2σ~D.
[Zur Überprüfung habe ich gerade eine Simulation durchgeführt, bei der ich normale Stichproben der Größe 30 generiert habe (mit gleicher Varianz, obwohl ich sie bei der Berechnung nicht angenommen habe), und der Test ist antikonservativ (dh die Fehlerrate vom Typ I ist höher als nominal). Wenn Sie also versuchen, einen 5% -Test durchzuführen, sieht es so aus, als würden Sie tatsächlich irgendwo im Bereich von 6,8% ankommen (die Annäherung wird wahrscheinlich etwas schlechter sein, wenn sich die Varianzen unterscheiden). Wenn Sie das tolerieren können, ist das wahrscheinlich in Ordnung. Natürlich könnten Sie das Signifikanzniveau senken, um den Antikonservatismus auszugleichen, aber ich würde gerne in die Kugel beißen und Option 2 ausprobieren. Sobald die Stichprobengröße etwa 200 erreicht, funktioniert dies ziemlich gut.]
Wenn eine der Stichproben nicht groß ist, können Sie trotzdem etwas tun, aber die Verteilung der Statistik hängt von der genauen Methode ab, mit der die Quartile berechnet wurden, sowie von den jeweiligen Stichprobengrößen.
Insbesondere könnten Sie entweder
σ2
b. Nehmen Sie keine Annahme gleicher Varianz an und verwenden Sie eine Teststatistik, die einer Statistik vom Typ Welch-Satterthwaite ähnlicher ist.
Im ersten Fall könnte die Verteilung der Teststatistik ziemlich einfach durch Simulation aus der angenommenen Verteilung erhalten werden. (Im zweiten Fall sind die Dinge etwas komplizierter, da die Verteilung davon abhängt, wie sich die Spreads unterscheiden - aber es könnte noch etwas getan werden.)
Wenn Sie nicht bereit sind, eine Verteilungsannahme zu treffen, können Sie die Standardabweichung der Stichprobe dennoch begrenzen und so die Ober- und Untergrenze der t-Statistik ermitteln. Die Grenzen sind jedoch möglicherweise nicht sehr eng.
Wenn Sie die Stichprobenmittel nicht gehabt hätten, könnten Sie die Mediane in einem Analogon des T-Tests verwenden. Wenn Sie von Normalität ausgehen (oder auch nur von Symmetrie und Existenz von Mitteln), schätzen die Mediane die jeweiligen Mittel; Da wir uns jedoch nur mit den Unterschieden in den Mitteln befassen müssen, reichen wesentlich schwächere Annahmen aus, damit dies als Test funktioniert.
In diesem Fall können Sie kritische Werte (oder tatsächlich p-Werte) ziemlich einfach über die Simulation erhalten, aber die Nullverteilung unter einer normalen Annahme ist ziemlich nahe an der t-Verteilung; Eine recht anständige Annäherung an den p-Wert kann aus t-Tabellen erhalten werden, aber geeignete Freiheitsgrade sind wesentlich niedriger als bei einem t-Test (fast die Hälfte!) - und die Teststatistik sollte skaliert werden auch, da die Abweichungen nicht genau übereinstimmen.
Dies hat im Normalfall keine besonders gute Leistung, aber eine gute Robustheit gegenüber Abweichungen von der Normalität.
Als Beispiel für eine Statistik dieser Form:
t∗= x~1- x~2q21/ n+ q22/ n
xich~ichqichichn
t∗c ⋅ t40c = 1,064
cn