P.( M.ich< Fj) > 12ich , jM.ichich
Natürlich sind andere Interpretationen des Ausdrucks möglich (das ist schließlich Mehrdeutigkeit), und einige dieser anderen Möglichkeiten stimmen möglicherweise mit Ihrer Argumentation überein.
[Wir haben auch die Frage, ob es sich um Stichproben oder Populationen handelt ... "Die meisten Männer [...] die meisten Frauen" scheinen eine Bevölkerungsaussage zu sein (über eine Population potenzieller Zeiten), aber wir haben nur Zeiten beobachtet dass wir anscheinend als Stichprobe behandelt werden, also müssen wir vorsichtig sein, wie weit wir den Anspruch erheben.]
P.( M.ich< Fj) > 12M.˜< F˜
[Ich sage nicht, dass Sie sich irren , wenn Sie denken, dass der Anteil zufälliger MF-Paare, bei denen der Mann schneller war als die Frau, mehr als die Hälfte beträgt - Sie haben mit ziemlicher Sicherheit Recht. Ich sage nur, dass Sie es nicht durch einen Vergleich der Mediane erkennen können. Sie können es auch nicht anhand des Anteils in jeder Stichprobe über oder unter dem Median der anderen Stichprobe erkennen. Sie müssten einen anderen Vergleich anstellen.]
12
Beispiel:
Datensatz A:
1.58 2.10 16.64 17.34 18.74 19.90 1.53 2.78 16.48 17.53 18.57 19.05
1.64 2.01 16.79 17.10 18.14 19.70 1.25 2.73 16.19 17.76 18.82 19.08
1.42 2.56 16.73 17.01 18.86 19.98
Datensatz B:
3.35 4.62 5.03 20.97 21.25 22.92 3.12 4.83 5.29 20.82 21.64 22.06
3.39 4.67 5.34 20.52 21.10 22.29 3.38 4.96 5.70 20.45 21.67 22.89
3.44 4.13 6.00 20.85 21.82 22.05
Datensatz C:
6.63 7.92 8.15 9.97 23.34 24.70 6.40 7.54 8.24 9.37 23.33 24.26
6.18 7.74 8.63 9.62 23.07 24.80 6.54 7.37 8.37 9.09 23.22 24.16
6.57 7.58 8.81 9.08 23.43 24.45
(Die Daten sind hier , werden dort aber für einen anderen Zweck verwendet - meiner Erinnerung nach habe ich diese selbst erstellt.)
Beachten Sie, dass der Anteil von A <B 2/3 beträgt, der Anteil von A <C 5/9 beträgt und der Anteil von B <C 2/3 beträgt. Sowohl A gegen B als auch B gegen C sind bei 5% signifikant, aber wir können jedes Signifikanzniveau erreichen, indem wir einfach genügend Kopien der Proben hinzufügen. Wir können sogar Bindungen vermeiden, indem wir die Samples duplizieren, aber ausreichend kleinen Jitter hinzufügen (ausreichend kleiner als die kleinste Lücke zwischen den Punkten).
Die Stichprobenmediane gehen in die andere Richtung: Median (A)> Median (B)> Median (C)
Wiederum konnten wir durch Wiederholen der Proben eine Signifikanz für einen Vergleich der Mediane - mit jedem Signifikanzniveau - erreichen.
Um es mit dem gegenwärtigen Problem in Verbindung zu bringen, stellen Sie sich vor, dass A "Frauenzeit" und B "Männerzeit" ist. Dann ist die mittlere Männerzeit schneller, aber ein zufällig ausgewählter Mann ist 2/3 der Zeit langsamer als eine zufällig ausgewählte Frau.
Ausgehend von den Stichproben A und C können wir einen größeren Datensatz (in R) wie folgt generieren:
n <- 300
F <- c(runif(n/3,0,5),runif(n-n/3,15,20))
M <- c(runif(n-n/3,7.5,12.5),runif(n/3,22.5,27.5))
Der Median von F liegt bei 16,25, während der Median von M bei 11,25 liegt, aber der Anteil der Fälle, in denen F <M ist, liegt bei 5/9.
[Wenn wir die n / 3 durch eine Binomialvariable mit den Parametern ersetzenn13
P.( F.< med ( M.) ) = 23P.( M.> med ( F.) ) = 23med ( M.) < med ( F.)