Wenn Sie davon ausgehen, dass die Verteilung der beiden Stichproben unterschiedlich ist, stellen Sie zunächst sicher, dass Sie die Welch-Version des t-Tests verwenden, bei der ungleiche Abweichungen zwischen den Gruppen angenommen werden. Dies wird zumindest versuchen, einige der Unterschiede zu berücksichtigen, die aufgrund der Verteilung auftreten.
Wenn wir uns die Formel für den Welch-T-Test ansehen:
t = X¯¯¯¯1- X¯¯¯¯2sX¯¯¯¯¯1- X¯¯¯¯¯2
sX¯¯¯¯¯1- X¯¯¯¯¯2
sX¯¯¯¯¯1- X¯¯¯¯¯2= s21n1+ s22n2--------√
wir können sehen, dass wir jedes Mal, wenn es ein s gibt , wissen, dass die Varianz berücksichtigt wird. Stellen wir uns vor, die beiden Varianzen sind tatsächlich gleich, aber eine ist schief, was zu einer unterschiedlichen Varianzschätzung führt. Wenn diese Schätzung der Varianz aufgrund des Versatzes nicht für Ihre Daten repräsentativ ist, ist der tatsächliche Verzerrungseffekt im Wesentlichen die Quadratwurzel dieser Verzerrung geteilt durch die Anzahl der zur Berechnung verwendeten Datenpunkte. Daher wird der Effekt schlechter Varianzschätzer ein wenig durch die Quadratwurzel und ein höheres n gedämpft, und dies ist wahrscheinlich der Grund, warum der Konsens darin besteht, dass es ein robuster Test bleibt.
Das andere Problem bei verzerrten Verteilungen besteht darin, dass die Mittelwertberechnung ebenfalls beeinträchtigt wird. Hier liegen wahrscheinlich die eigentlichen Probleme bei Verstößen gegen die Testannahme, da die Mittelwerte relativ verzerrungsempfindlich sind. Und die Robustheit des Tests kann grob bestimmt werden, indem die Differenz der Mittelwerte im Vergleich zur Differenz der Mediane (als Idee) berechnet wird. Vielleicht könnten Sie sogar versuchen, die Differenz der Mittelwerte durch die Differenz der Mediane im t-Test als robustere Messgröße zu ersetzen (ich bin sicher, dass dies jemand besprochen hat, aber ich konnte bei Google nicht schnell genug einen Link finden).
Ich würde auch vorschlagen, einen Permutationstest durchzuführen, wenn Sie nur einen T-Test durchführen. Der Permutationstest ist ein exakter Test, der von Verteilungsannahmen unabhängig ist. Am wichtigsten ist, dass die Permutationstests und der t-Test zu identischen Ergebnissen führen, wenn die Annahmen des parametrischen Tests erfüllt sind . Daher kann das Robustheitsmaß, das Sie suchen, 1 sein - der Unterschied zwischen den p-Werten für Permutation und t-Test, wobei ein Wert von 1 eine perfekte Robustheit und 0 eine überhaupt keine Robustheit impliziert.