Warum bedeutet die Tatsache, dass 1 Median niedriger als ein anderer Median ist, nicht, dass die meisten in Gruppe 1 kleiner sind als die meisten in Gruppe 2?


9

Ich glaubte, dass die folgenden Boxplots als "die meisten Männer sind schneller als die meisten Frauen" (in diesem Datensatz) interpretiert werden könnten, hauptsächlich weil die mittlere Männerzeit niedriger war als die mittlere Frauenzeit. Aber der EdX-Kurs zu R und Statistik- Quiz hat mir gesagt, dass das falsch ist. Bitte helfen Sie mir zu verstehen, warum meine Intuition falsch ist.

Hier ist die Frage:

Betrachten wir eine zufällige Auswahl von Finishern des New York City Marathons im Jahr 2002. Dieser Datensatz befindet sich im UsingR-Paket. Laden Sie die Bibliothek und dann den Datensatz nym.2002.

library(dplyr)
data(nym.2002, package="UsingR")

Verwenden Sie Boxplots und Histogramme, um die Endzeiten von Männern und Frauen zu vergleichen. Welche der folgenden Aussagen beschreibt den Unterschied am besten?

  1. Männer und Frauen haben die gleiche Verteilung.
  2. Die meisten Männer sind schneller als die meisten Frauen.
  3. Männchen und Weibchen haben ähnliche rechtsverzerrte Verteilungen wie das erstere, 20 Minuten nach links verschoben.
  4. Beide Verteilungen sind normalerweise mit einer Differenz von durchschnittlich etwa 30 Minuten verteilt.

Hier sind die NYC-Marathonzeiten für Männer und Frauen als Quantile, Histogramme und Boxplots:

# Men's time quantile
      0%      25%      50%      75%     100% 
147.3333 226.1333 256.0167 290.6375 508.0833

# Women's time quantile
      0%      25%      50%      75%     100% 
175.5333 250.8208 277.7250 309.4625 566.7833

Männliche und weibliche Zeiten - Histogramm

Männliche und weibliche Zeiten - Boxplot


Um visuell nach derselben Verteilung zu suchen, sollten Ihre Histogramme dieselbe x-Domäne und dieselben Bins verwenden, während die y-Achse die relative Häufigkeit anzeigen sollte. Die Behälterbandgröße würde von einer höheren Granularität profitieren, z. B. 25 oder 50 Minuten. Zeichnen Sie außerdem sowohl in Boxplots als auch in Histogrammen den Median (bereits im Boxplot), den Mittelwert und den Modus.
G3O2

{0,3}}{2}}0,5P.(X.>Y.)>0,5

Antworten:


7

Ich denke, dass der Grund, warum Sie als falsch markiert wurden, nicht so sehr darin besteht, dass die Antwort, die Sie auf die Mehrwahlfrage gegeben haben, falsch war, sondern dass Option 3 "Männer und Frauen haben ähnliche rechtsverzerrte Verteilungen wie die erstere, 20 Minuten nach links verschoben". wäre eine bessere Wahl gewesen, da es auf der Grundlage der bereitgestellten Informationen informativer ist.


Ich stimme dieser Erklärung zu. Auch "am schnellsten als am meisten" ist so vieldeutig. Trotz der Antwort von @glen_b würde ich für diese Art von Sprache viel mehr Trennung in den Boxplots erwarten. Zum Beispiel "75% der Männer sind schneller als 75% der Frauen", was meiner Meinung nach bedeuten würde, dass das 75. Perzentil der Männerzeit niedriger ist als das 25. Perzentil der Frauenzeit. Aber die Sprache ist nicht eindeutig.
Sal Mangiafico

1
Dies führt auch zu einem Prinzip der Durchführung von Multiple-Choice-Tests: Wählen Sie immer die beste Antwort.
Sal Mangiafico

Das macht Sinn; Es ist nicht so, dass die andere Wahl FALSCH war, sondern dass die richtige Wahl ("Männer und Frauen haben ähnliche rechtsverzerrte Verteilungen wie die erstere, 20 Minuten nach links verschoben.") wahrer war. Allerdings sehe ich die 20-minütige Verschiebung in den Histogrammen nicht ganz. Für mich sieht es eher nach einer 50-minütigen Schicht aus. Da ich zwei Chancen hatte, habe ich die Frage richtig gestellt, FWIW :-).
Kreuzkümmel

@cumin: Ich bin mir nicht sicher, ob das richtig ist. "Die meisten Männer sind schneller als die meisten Frauen" ist vage, was "die meisten" bedeuten - ich glaube nicht, dass ich jemals eine strenge Definition gesehen habe, und intuitiv sind es normalerweise deutlich mehr als 50% (vielleicht 70% +?) . Wenn sie "die Mehrheit" sagten, wäre es vielleicht klarer.
user541686

9

Hier ist das kleinste Gegenbeispiel, das ich finden konnte:

A 1,4,10;  B 0,6,9

  • A ( [1, 4, 10])und B ( [0, 6, 9]) haben den gleichen Durchschnitt ( 5)

  • B hat einen größeren Median ( 6) als A ( 4)

  • Es besteht eine Wahrscheinlichkeit von 5/9, dass ein zufälliges A- Element größer als ein zufälliges B- Element ist.

Hier ist ein weiteres Beispiel mit 4 Elementen:

A 1,1,3,10;  B 0,0,6,9


7

P.(M.ich<F.j)>12ich,jM.ichich

Natürlich sind andere Interpretationen des Ausdrucks möglich (das ist schließlich Mehrdeutigkeit), und einige dieser anderen Möglichkeiten stimmen möglicherweise mit Ihrer Argumentation überein.

[Wir haben auch die Frage, ob es sich um Stichproben oder Populationen handelt ... "Die meisten Männer [...] die meisten Frauen" scheinen eine Bevölkerungsaussage zu sein (über eine Population potenzieller Zeiten), aber wir haben nur Zeiten beobachtet dass wir anscheinend als Stichprobe behandelt werden, also müssen wir vorsichtig sein, wie weit wir den Anspruch erheben.]

P.(M.ich<F.j)>12M.~<F.~

[Ich sage nicht, dass Sie sich irren , wenn Sie denken, dass der Anteil zufälliger MF-Paare, bei denen der Mann schneller war als die Frau, mehr als die Hälfte beträgt - Sie haben mit ziemlicher Sicherheit Recht. Ich sage nur, dass Sie es nicht durch einen Vergleich der Mediane erkennen können. Sie können es auch nicht anhand des Anteils in jeder Stichprobe über oder unter dem Median der anderen Stichprobe erkennen. Sie müssten einen anderen Vergleich anstellen.]

12


Beispiel:

Datensatz A:

 1.58  2.10 16.64 17.34 18.74 19.90  1.53  2.78 16.48 17.53 18.57 19.05
 1.64  2.01 16.79 17.10 18.14 19.70  1.25  2.73 16.19 17.76 18.82 19.08
 1.42  2.56 16.73 17.01 18.86 19.98

Datensatz B:

 3.35  4.62  5.03 20.97 21.25 22.92  3.12  4.83  5.29 20.82 21.64 22.06
 3.39  4.67  5.34 20.52 21.10 22.29  3.38  4.96  5.70 20.45 21.67 22.89
 3.44  4.13  6.00 20.85 21.82 22.05

Datensatz C:

 6.63  7.92  8.15  9.97 23.34 24.70  6.40  7.54  8.24  9.37 23.33 24.26
 6.18  7.74  8.63  9.62 23.07 24.80  6.54  7.37  8.37  9.09 23.22 24.16
 6.57  7.58  8.81  9.08 23.43 24.45

(Die Daten sind hier , werden dort aber für einen anderen Zweck verwendet - meiner Erinnerung nach habe ich diese selbst erstellt.)

Beachten Sie, dass der Anteil von A <B 2/3 beträgt, der Anteil von A <C 5/9 beträgt und der Anteil von B <C 2/3 beträgt. Sowohl A gegen B als auch B gegen C sind bei 5% signifikant, aber wir können jedes Signifikanzniveau erreichen, indem wir einfach genügend Kopien der Proben hinzufügen. Wir können sogar Bindungen vermeiden, indem wir die Samples duplizieren, aber ausreichend kleinen Jitter hinzufügen (ausreichend kleiner als die kleinste Lücke zwischen den Punkten).

Die Stichprobenmediane gehen in die andere Richtung: Median (A)> Median (B)> Median (C)

Wiederum konnten wir durch Wiederholen der Proben eine Signifikanz für einen Vergleich der Mediane - mit jedem Signifikanzniveau - erreichen.

Streifendiagramm der Proben A, B und C mit Medianen, die mit P (A <B) in entgegengesetzter Richtung zu Medianen usw. Markiert sind

Um es mit dem gegenwärtigen Problem in Verbindung zu bringen, stellen Sie sich vor, dass A "Frauenzeit" und B "Männerzeit" ist. Dann ist die mittlere Männerzeit schneller, aber ein zufällig ausgewählter Mann ist 2/3 der Zeit langsamer als eine zufällig ausgewählte Frau.

Ausgehend von den Stichproben A und C können wir einen größeren Datensatz (in R) wie folgt generieren:

n <- 300
F <- c(runif(n/3,0,5),runif(n-n/3,15,20))
M <- c(runif(n-n/3,7.5,12.5),runif(n/3,22.5,27.5))

Der Median von F liegt bei 16,25, während der Median von M bei 11,25 liegt, aber der Anteil der Fälle, in denen F <M ist, liegt bei 5/9.

[Wenn wir die n / 3 durch eine Binomialvariable mit den Parametern ersetzenn13

P.(F.<med(M.))=23P.(M.>med(F.))=23med(M.)<med(F.)


Ich kann sehen, wie die Mittel in entgegengesetzte Richtungen gehen können, aber ich gebe zu, dass meine Intuitionen hier mit den OPs übereinstimmen. Ich sehe nicht, wie die Mediane können (abgesehen vom Problem des Stichprobenfehlers).
Gung - Reinstate Monica

@gung Ich habe ein Beispiel aufgenommen. Ich liebe es, meine anfänglichen Intuitionen auf diese Weise zu stechen - indem ich Gegenbeispiele zu ihnen finde. Wenn ich auf mehr stoße (ich glaube, ich habe irgendwo einen anderen), werde ich versuchen, sie zu erwähnen.
Glen_b -State Monica

Das Boxplot in der ursprünglichen Frage zeigt, dass etwa 60-65% (per Augapfel) der Männer eine Zeit haben, die kürzer ist als die mittlere Zeit für Frauen (dh weniger als die Zeit für 50% der Frauen). Das ist das Stück, das ich gerne weg erklärt hätte.
Kreuzkümmel

P.(EINich<C.j)ichj

3
Ich würde den Ausdruck "die meisten Männer sind schneller als die meisten Frauen" als "mindestens 50% der Männer sind schneller als mindestens 50% der Frauen" interpretieren. Mit anderen Worten: Bei einem Mann X ist es sinnvoll zu fragen, ob X schneller als 50% der Frauen ist. Für mich besagt die Behauptung dann, dass mindestens 50% der Männer diese Eigenschaft haben. Dies ist (glaube ich) WAHR, wenn der mittlere Mann schneller als die mittlere Frau ist, da 50% der Männer schneller wären als der mittlere Mann, der schneller ist als die mittlere Frau, die schneller als 50% der Frauen ist. (Beachten Sie jedoch, dass dies nur 25% der Frauen-Mann-Paare abdeckt, was
meines Erachtens

3

Die folgenden Abbildungen stammen aus diesem Blogbeitrag , der eine wichtige praktische Anwendung dieser Ideen veranschaulicht .

Die Standardisierung bietet ein leistungsstarkes Gerät zum Vergleichen von zwei Verteilungen. Die folgenden 3 Zahlen vergleichen die Körpergröße von 130 Monate alten Jungen und Mädchen aus dem englischen National Child Measurement Program (NCMP). (Dies war das modale Alter in diesem Datensatz. Ich habe es einfach ausgewählt, um die meisten Daten und damit die glattesten Diagramme innerhalb einer einzelnen Alterskohorte zu erhalten.)

Abbildung 1: Körpergröße von Jungen und Mädchen im Alter von 130 Monaten nach dem National Child Measurement Program (NCMP) in England

Abbildung 1: Körpergröße von Jungen und Mädchen im Alter von 130 Monaten nach dem National Child Measurement Program (NCMP) in England

Abbildung 2: Perzentile der Körpergröße für Jungen und Mädchen im Alter von 130 Monaten.  Quelle: Englisch NCMP

Abbildung 2: Perzentile der Körpergröße für Jungen und Mädchen im Alter von 130 Monaten. Quelle: Englisch NCMP

Abbildung 3: Größenverteilung von 130 Monate alten Mädchen im Verhältnis zu gleichaltrigen Jungen.

Abbildung 3: Größenverteilung von 130 Monate alten Mädchen im Verhältnis zu gleichaltrigen Jungen.

In der letzten dieser Figuren wurde der Höhenvergleich nach Jungenhöhen standardisiert . Wenn Sie also entlang der gepunkteten grauen Linien in Abbildung 3 lesen, können Sie folgende Aussagen treffen:

  • Die mittlere Körpergröße (dh das 50. Perzentil) für Jungen beträgt für Mädchen nur etwa das 45. Perzentil. Somit waren 100% - 45% = 55% der Mädchen größer als der mittlere Junge.
  • Die Höhe des oberen Quartils (75. Perzentil) für Mädchen trifft das obere Quintil (80. Perzentil) für Jungen. So ist unter Kindern im Alter von 130 Monaten ein Mädchen, das größer als 3 von 4 Mädchen ist, auch größer als 4 von 5 Jungen.

Ein Punkt möglicher Verwirrung in dieser Handlung verdient Erwähnung. Obwohl die 45 ° -Linie der Jungen auf dem Grundstück „höher“ ist als die Magentakurve der Mädchen, entspricht diese Beobachtung dennoch der bekannten Tatsache, dass die Mädchen in diesem Alter (dies sind Schüler der 6. Klasse) in der Regel größer sind als die Jungen . Beachten Sie, dass sich diese Größe in der Tatsache widerspiegelt, dass die Magentakurve relativ zur blauen Linie nach rechts verschoben ist .

(0,0)(1,1)

Ihre ursprüngliche Frage kann nun geometrisch neu formuliert werden, als eine Frage, ob Sie die Magentakurve von Abbildung 3 zeichnen könnten, um gleichzeitig (a) die postulierte Beziehung zwischen den Medianen und (b) die leicht schwer fassbare Beziehung zu @Glen_b zu erreichen (richtig, glaube ich) in seiner Antwort erklärt. Ich frage mich, ob Verteilungsdiskontinuitäten (Punktmassen in den Dichten) die Bereitstellung eines "pathologischen" Falls ermöglichen könnten. Ich vermute, dass ein solcher pathologischer Fall die "Ausnahme sein wird, die die Regel bestätigt".


xxhat diese Eigenschaft. Aus diesem Grund wäre die Antwort auf die Quizfrage ja .

Wenn andererseits die tatsächliche Absicht von "am meisten" "> 50%" war, könnte man erwarten, dass der genauere Ausdruck "eine Mehrheit von" verwendet wurde. Wenn mir jemand sagt, dass "wahrscheinlich" etwas passieren wird, würde ich denken, dass auf eine subjektive Wahrscheinlichkeit von 60% oder mehr angespielt wird. Ebenso bedeutet "am meisten" für mich etwas mehr als 70–80%. Aus der obigen Darstellung geht klar hervor, dass wenn die meisten als ein Kriterium angesehen werden, das strenger als 52,5% ist, man nicht sagen kann: "Die meisten Mädchen [haben die Eigenschaft, dass sie] größer sind als die meisten Jungen." Ich frage mich, ob ein Teil der Begründung für die Quizfrage darin bestand, eine Prüfung von Wörtern anzuregen, die sich auf numerische Begriffe beziehen. (Wenn Sie der Meinung sind, dass dies alles etwas albern ist, betrachten Sie diese GrafikenDies zeigt, wie Menschen dazu neigen, verschiedene probabilistische Wörter und Phrasen zu interpretieren.) Vielleicht war es auch die Absicht, den Punkt zu unterstreichen, dass in realen Verteilungen viele Variationen vorhanden sind und dass eine einzige Statistik (Median, Mittelwert, Was-Haben-) Sie) werden selten breite, umfassende Aussagen unterstützen.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.