Die wichtigere Statistik: "90 Prozent aller Frauen überlebten" oder "90 Prozent aller Überlebenden waren Frauen"?


14

Beachten Sie die folgenden Aussagen zur Titanic:

Annahme 1: Nur Männer und Frauen befanden sich auf dem Schiff

Annahme 2: Es gab eine große Anzahl von Männern und Frauen

Aussage 1: 90 Prozent aller Frauen überlebten

Aussage 2: 90 Prozent aller Überlebenden waren Frauen

Die erste zeigt, dass die Rettung von Frauen wahrscheinlich von hoher Priorität war (unabhängig davon, ob es sich um eine Rettung von Männern handelte).

Wann ist die zweite Statistik nützlich?

Können wir sagen, dass einer von ihnen fast immer nützlicher ist als der andere?


40
mehr nützlich für welchen Zweck?
Aksakal

12
Überrascht hat keine dieser Antworten Simpsons Paradoxon
Nemo

3
Ich würde sagen, das hängt davon ab, ob Sie eine Frau sind oder nicht!
meh

6
Die erste Aussage ist ohne eine vergleichbare Statistik für Männer nicht aussagekräftig.
Barmar

1
@RahulSaha Aber wenn 95% der Männer überleben, könnte dies bedeuten, dass sie den Männern eine noch höhere Priorität einräumen. Deshalb ist ein Vergleich nötig.
Barmar

Antworten:


54

Zum jetzigen Zeitpunkt ist weder eine der Aussagen 1 noch 2 sehr nützlich. Wenn 90% der Passagiere Frauen wären und 90% der Menschen nach dem Zufallsprinzip überleben würden, wären beide Aussagen wahr. Die Aussagen sind im Zusammenhang mit der Gesamtzusammensetzung der Fahrgäste zu berücksichtigen. Und die allgemeine Überlebenschance.


Angenommen, wir hatten so viele Männer wie Frauen, je 100. Hier einige mögliche Matrizen von Männern (M) gegen Frauen (W) und Überlebenden (S) gegen Tote (D):

  |  M |  W
------------
S | 90 | 90
------------
D | 10 | 10

90% der Frauen überlebten. Wie 90% der Männer. Aussage 1 ist wahr, Aussage 2 ist falsch, da die Hälfte der Überlebenden Frauen waren. Dies steht im Einklang mit vielen Überlebenden, aber keinen Unterschied zwischen den Geschlechtern .

  |  M |  W
------------
S | 10 | 90
------------
D | 90 | 10

90% der Frauen überlebten, aber nur 10% der Männer. 90% der Überlebenden waren Frauen. Beide Aussagen sind wahr. Dies steht im Einklang mit einem Unterschied zwischen den Geschlechtern : Frauen überlebten mit höherer Wahrscheinlichkeit als Männer.

  |  M |  W
------------
S |  1 |  9
------------
D | 99 | 91

9% der Frauen überlebten, aber nur 1% der Männer. 90% der Überlebenden waren Frauen. Aussage 1 ist falsch, Aussage 2 ist wahr. Dies steht wiederum im Einklang mit einem Unterschied zwischen den Geschlechtern : Frauen überlebten mit höherer Wahrscheinlichkeit als Männer.


3
(or indeed, if *everyone* survived)... Wenn alle überlebten, überlebten 100% aller Frauen, unabhängig von den Proportionen.
Bridgeburners

1
@Bridgeburners: Sie haben völlig Recht, und es hat mich getroffen, als ich nicht an meinem Computer war. Danke, ich habe meine Antwort bearbeitet.
S. Kolassa - Reinstate Monica

18

Auf den ersten Blick ist die bedingte Überlebenswahrscheinlichkeit aufgrund des Geschlechts nützlicher, allein aufgrund der Richtung des Informationsflusses. Das Geschlecht einer Person ist vor ihrem oder ihrem Überlebensstatus bekannt, und diese Wahrscheinlichkeit kann prospektiv in einem vorhersagenden Sinne verwendet werden. Es wird auch nicht durch die Prävalenz von Frauen beeinflusst. Wenn Sie Zweifel haben, denken Sie an Voraussagen.


Ja, auf den ersten Blick. Nur um sicherzugehen, dass ich verstehe, wie das auf die fraglichen Statistiken zutrifft ... Sie sagen, Aussage Nr. 1 ist nützlich, weil sie mir sagt, wenn ich zufällig eine Frau bin, dann an Bord eines großen Passagierschiffs im Jahr 1912 sinkt zufällig in eisbergverseuchten Gewässern, besteht dann eine Überlebenschance von 90%? Und unter der Annahme, dass sich die lebensrettenden Technologien und Praktiken seitdem verbessert haben, ist die Chance, dass ich eine solche Situation heute überlebe, wahrscheinlich sogar besser als 90%? Cool! ;-)
Don Hatch

Diese Kommentare gehen über das ursprüngliche beschreibende Ziel hinaus.
Frank Harrell

Bist du sicher, dass du das richtige Ziel hast? Die Frage ist anscheinend, wie nützlich diese Aussagen über die echte Titanic sind, die in Wirklichkeit nicht allzu nützlich sind, um Vorhersagen zu treffen, weil sich seitdem so viel geändert hat. Ihre Heuristik scheint also beim ersten wirklichen Beispiel gescheitert zu sein, nicht wahr? Das scheint kein guter Anfang zu sein. Auf der anderen Seite, vielleicht sollte das OP die Titanic Frage ein Proxy für die allgemeine Frage der gleichen Form zu aktuellen Szenarien angewandt werden , die tun prädiktive Relevanz haben; Ich weiß es nicht.
Don Hatch

1
So wie ich in meinem Buch Regressionsmodellierungsstrategien eine detaillierte Fallstudie über die Überlebenswahrscheinlichkeiten von TItanic-Passagieren habe , ist es sehr wertvoll, herauszufinden , was passiert ist. Ich verwende keine vorhergesagten Wahrscheinlichkeiten aus diesem logistischen Modell, um zukünftige Titanics vorherzusagen, sondern um Muster bei der Auswahl von Rettungsbooten zu entdecken.
Frank Harrell

6

Die erste zeigt, dass die Rettung von Frauen wahrscheinlich von hoher Priorität war (unabhängig davon, ob es sich um eine Rettung von Männern handelte).

Das Wort "Priorität" kommt aus dem Lateinischen für "vor". Eine Priorität ist etwas, das vor etwas anderem steht (wobei "vorher" im Sinne von "wichtiger" verwendet wird). Wenn Sie sagen, dass die Rettung von Frauen Priorität hatte, muss die Rettung von Frauen vor etwas anderem stehen. Und die natürliche Annahme ist, dass es darum geht, Menschen zu retten. Wenn Sie sagen "unabhängig davon, ob es sich um die Rettung von Männern handelt", fragen wir uns, was es bisher gab.

Dass Frauen eine hohe Überlebensrate hatten, sagt nicht viel aus, wenn wir nicht wissen, wie hoch die allgemeine Überlebensrate war. Das letzte Schiff, auf dem ich war, überlebten über 90% der Frauen, aber ich würde das nicht als Beweis dafür bezeichnen, dass die Rettung von Frauen eine hohe Priorität hatte.

Und zu wissen, wie viel Prozent der Überlebenden Frauen waren, sagt nicht viel aus, ohne zu wissen, wie viel Prozent der Menschen insgesamt Frauen waren.

Welche Statistik nützlicher ist, hängt wirklich von der Situation ab. Wenn Sie wissen möchten, wie gefährlich etwas ist, ist die Sterberate wichtiger. Wenn Sie wissen möchten, wie gefährlich etwas ist, ist die prozentuale Aufteilung der Opfer wichtig.


2
Nette Kritik :-) "Das letzte Schiff, auf dem ich war, hat über 90% der Frauen überlebt, aber ich würde das nicht so charakterisieren, als ob die Rettung von Frauen eine hohe Priorität hatte." Sicher, es hat eine hohe Priorität im Vergleich zu über Bord werfen! Sicher, dies ist eine absurde Interpretation von "hoher Priorität", aber da das OP die Interpretation "höhere Priorität als die Rettung von Männern" ausgeschlossen hat, bleiben uns nur absurde Interpretationen.
Don Hatch

3

Für uns ist es möglicherweise nützlich zu untersuchen, wie diese Wahrscheinlichkeiten zusammenhängen.

WS

P(S|W)=0.9

P(W|S)=0.9

Der Bayes-Satz zeigt, wie diese Wahrscheinlichkeitsaussagen zusammenhängen.

P(S|W)=P(W|S)P(S)P(W)

P(S)P(W) (der Anteil von Frauen an der Titanic) recht einfach nachzuschlagen, und daher sind die Wahrscheinlichkeiten voneinander abhängig. Das heißt, zu wissen, dass eines das andere vollständig definiert.

P(S)P(W)


3
Umgekehrt zu Ihrer Schlussfolgerung würde ich auch sagen, dass, wenn weder P (S) noch P (W) bekannt sind, sowohl P (S | W) als auch P (W | S) unter demselben frustrierenden Mangel an Nützlichkeit leiden. Ich habe noch kein klares Bild davon, was gesagt werden kann, wenn genau eines von P (S) und P (W) bekannt ist.
Don Hatch

P(W)=0.5

1
Ja, das sieht richtig aus, und das Urteil scheint zu sein, dass die Informationen ungemein unzureichend sind, auch wenn dies so ist. Ich muss sagen, jedes Mal, wenn ich darüber nachdenke, welche Informationen ich aus nur P (W | S) oder nur P (S | W) extrahieren kann, auch wenn ich P (W) oder was auch immer hinzufüge, denke ich am Ende: "Warum um alles in der Welt?" Ich denke darüber nach. Warum haben sie mir nur diese Prozentsätze gegeben? Zeigen Sie mir einfach den ganzen Tisch. "
Don Hatch

3

Es kommt darauf an, was man für nützlich hält.

P(S|W)>P(S|M) , sind beide Aussagen ohne weitere Informationen gleichermaßen nutzlos, wie @StephanKolassa und @knrumsey bereits gesagt haben in ihren Antworten. Wenn jemand beabsichtigt, diese Art von Informationen auszudrücken, muss er etwas anderes als Aussage 1 sagen, wie "90 Prozent der Frauen überlebten, aber nur 20 Prozent der Männer überlebten".

Auf der anderen Seite, wenn Sie sich fragen, warum Überlebensgeschichten meistens von Frauen stammen, würde Aussage 2 dies erklären, was Aussage 2 auch dann nützlich macht, wenn keine anderen Informationen vorliegen.

Ich kann mir nichts vorstellen, für das Aussage 1 außerhalb des Kontexts nützlich ist. Über die Priorität, die der Rettung von Frauen eingeräumt wird, wird im Vergleich zu allem anderen nichts gesagt. Das Einzige, was Aussage 1 für mich bedeutet, ist, dass ich sage "Erzähl mir mehr".


0

An der Oberfläche (oder isoliert von der Realität) scheinen beide Aussagen für das Staatsziel gleichermaßen nutzlos zu sein. In Anbetracht des Kontexts ist die zweite Aussage jedoch deutlich nützlicher.

Aussage 2

w

w=px/(px+(1p)z)
pxz

H0:x>z

H0

(1w)px=w(1p)z
x=w(1p)z/((1w)p)
H0
x=w(1p)z/((1w)p)>z
w(1p)>(1w)p
0.9(1p)>0.1p
1p>p/9
p<0.9

p1/2

Aussage 1

x=0.9zx>z

xz

p1/2px+(1p)zxzp1/2

px+(1p)zx=0.9
In other words 90% of all passengers survived, which doesn't ring true to me. Would they make a movie and talk about it for 100 years if 90% of passengers survived? So, it must be that x>>z and less than half of passengers made it.

Conclusion

I'd say that both statements support your hypo that women were more likely to survive than men, but Statement 1 does so rather weakly, while Statement 2 in combination with assumptions almost surely establishes your hypo as a fact.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.