Wie hoch ist die Wahrscheinlichkeit, dass diese Person weiblich ist?


32

Es gibt eine Person hinter einem Vorhang - ich weiß nicht, ob die Person weiblich oder männlich ist.

Ich weiß, dass die Person lange Haare hat und dass 90% aller Menschen mit langen Haaren weiblich sind

Ich weiß, dass die Person eine seltene Blutgruppe AX3 hat und dass 80% aller Menschen mit dieser Blutgruppe weiblich sind.

Wie groß ist die Wahrscheinlichkeit, dass die Person weiblich ist?

HINWEIS: Diese ursprüngliche Formulierung wurde um zwei weitere Annahmen erweitert: 1. Blutgruppe und Haarlänge sind unabhängig. 2. Das Verhältnis Mann: Frau in der Gesamtbevölkerung beträgt 50:50

(Das spezifische Szenario hier ist nicht so relevant - vielmehr habe ich ein dringendes Projekt, bei dem ich mich um den richtigen Ansatz für die Beantwortung dieser Frage kümmern muss. Mein Bauchgefühl ist, dass es sich eher um eine Frage der einfachen Wahrscheinlichkeit mit einer einfachen endgültigen Antwort handelt als etwas mit mehreren umstrittenen Antworten nach verschiedenen statistischen Theorien.)


1
Es gibt keine multiplen Wahrscheinlichkeitstheorien, aber es ist bekannt, dass Menschen Schwierigkeiten haben, über Wahrscheinlichkeiten richtig nachzudenken. (Augustus DeMorgan, ein guter Mathematiker, gab das Studium der Wahrscheinlichkeit aufgrund seiner Schwierigkeiten auf.) Sehen Sie sich keine Debatten an: Suchen Sie nach Appellen zu Wahrscheinlichkeitsprinzipien (wie den Kolmogorov-Axiomen). Lassen Sie sich das nicht demokratisch lösen: Ihre Frage zieht viele unüberlegte Antworten an, die, auch wenn einige von ihnen zustimmen, nur kollektiv falsch sind. @Michael C gibt eine gute Anleitung; Meine Antwort versucht dir zu zeigen, warum er Recht hat.
Whuber

@Whuber, wenn Unabhängigkeit vorausgesetzt wird, würden Sie zustimmen, dass 0,97297 die richtige Antwort ist? (Ich glaube, dass die Antwort ohne diese Annahme irgendwo zwischen 0% und 100% liegen könnte - Ihre Diagramme zeigen dies gut).
Wahrscheinlich

Unabhängigkeit von was genau? Schlagen Sie vor, dass weibliche und männliche Frisuren gleich sind? Wie Sie in Ihrer Frage sagen, ist dieses spezielle Szenario, das Geschlecht, Haar- und Blutgruppe betrifft, möglicherweise nicht relevant. Das sagt mir, dass Sie verstehen möchten, wie Sie solche Probleme im Allgemeinen lösen können. Dazu müssen Sie wissen, welche Annahmen welche Schlussfolgerungen implizieren. Daher müssen Sie sich sehr genau auf die Annahmen konzentrieren, die Sie machen möchten, und genau bestimmen, wie viel Sie daraus schließen können.
whuber

3
Die Art der Unabhängigkeit, die erforscht werden muss, betrifft die Kombination aller drei Merkmale. Wenn AX3 beispielsweise ein Marker für ein Syndrom ist, das Kahlheit bei Frauen (aber nicht bei Männern) umfasst, ist jede langhaarige Person mit AX3 notwendigerweise männlich, sodass die Wahrscheinlichkeit, weiblich zu sein, 0% und nicht 97,3% beträgt. Ich hoffe, dies macht deutlich, dass jeder, der eine eindeutige Antwort auf diese Frage liefert , zusätzliche Annahmen treffen muss , auch wenn er sie nicht ausdrücklich anerkennt. Die wirklich nützlichen Antworten, IMHO, wären diejenigen, die direkt zeigen, wie unterschiedliche Annahmen zu unterschiedlichen Ergebnissen führen.
Whuber

2
Sie vermissen die Wahrscheinlichkeit, dass eine Frau keine langen Haare hat. Das ist eine kritische Maßnahme.
Daniel R Hicks

Antworten:


35

Viele Menschen finden es hilfreich, in Begriffen wie "Bevölkerung", Untergruppen darin und Proportionen (anstatt Wahrscheinlichkeiten) zu denken . Dies eignet sich für visuelles Denken.

Ich werde die Zahlen im Detail erläutern, aber ein schneller Vergleich der beiden Zahlen soll sofort und überzeugend zeigen, wie und warum keine konkrete Antwort auf die Frage gegeben werden kann. Eine etwas längere Untersuchung legt nahe, welche zusätzlichen Informationen zur Bestimmung einer Antwort oder zumindest zur Ermittlung von Grenzen für die Antworten nützlich wären.

Venn-Diagramm

Legende

Kreuzschraffur : weiblich / Fester Hintergrund : männlich.

Oben langhaarig, unten kurzhaarig.

Rechts (und farbig) : AX3 / Links (ungefärbt) : Nicht-AX3.

Daten

Die obere Schraffur macht 90% des oberen Rechtecks ​​aus ("90% aller Menschen mit langen Haaren sind weiblich").

Die gesamte Schraffur im rechten farbigen Rechteck macht 80% dieses Rechtecks ​​aus ("80% aller Menschen mit dieser Blutgruppe sind weiblich.")

Erläuterung

Dieses Diagramm zeigt schematisch, wie die Population (aller betrachteten Frauen und Nicht-Frauen) gleichzeitig in Frauen / Nicht-Frauen, AX3 / Nicht-AX3 und Langhaar / Nicht-Langhaar ("kurz") aufgeteilt werden kann. Zumindest annähernd wird die Fläche verwendet, um Proportionen darzustellen (es gibt einige Übertreibungen, um das Bild klarer zu machen).

Es ist offensichtlich, dass diese drei binären Klassifikationen acht mögliche Gruppen erzeugen. Jede Gruppe erscheint hier.

Die angegebenen Informationen besagen, dass das obere schraffierte Rechteck (langhaarige Frauen) 90% des oberen Rechtecks ​​ausmacht (alle langhaarigen Personen). Es heißt auch, dass die kombinierten schraffierten Teile der farbigen Rechtecke (langhaarige Frauen mit AX3 und kurzhaarige Frauen mit AX3) 80% der farbigen Region auf der rechten Seite ausmachen (alle Menschen mit AX3). Uns wird gesagt, dass jemand in der oberen rechten Ecke liegt (Pfeil): Langhaarige mit AX3. Welcher Anteil dieses Rechtecks ​​ist schraffiert (weiblich)?

Ich habe auch (implizit) angenommen, dass Blutgruppe und Haarlänge unabhängig sind : Der Anteil des oberen Rechtecks ​​(langes Haar), das gefärbt ist (AX3), entspricht dem Anteil des unteren Rechtecks ​​(kurzes Haar), das gefärbt ist (AX3). Das bedeutet Unabhängigkeit. Es ist eine faire und natürliche Annahme, solche Fragen anzusprechen, aber natürlich muss dies angegeben werden.

Die Position des oberen schraffierten Rechtecks ​​(langhaarige Frauen) ist unbekannt. Wir können uns vorstellen, das obere schraffierte Rechteck von Seite zu Seite zu schieben und das untere schraffierte Rechteck von Seite zu Seite zu schieben und möglicherweise seine Breite zu ändern. Wenn wir dies tun, damit 80% des farbigen Rechtecks ​​schraffiert bleiben, ändert eine solche Änderung keine der angegebenen Informationen, kann jedoch den Anteil der Frauen im oberen rechten Rechteck ändern. Offensichtlich könnte der Anteil irgendwo zwischen 0% und 100% liegen und dennoch mit den angegebenen Informationen übereinstimmen, wie in diesem Bild:

Figur 2


Eine Stärke dieser Methode besteht darin, dass es mehrere Antworten auf die Frage gibt. All dies könnte man algebraisch übersetzen und mittels der Festlegung von Wahrscheinlichkeiten konkrete Situationen als mögliche Beispiele anbieten, aber dann stellt sich die Frage, ob solche Beispiele wirklich mit den Daten übereinstimmen. Wenn zum Beispiel jemand vorschlägt, dass vielleicht 50% der Langhaarigen AX3 sind, ist zu Beginn nicht ersichtlich, dass dies bei allen verfügbaren Informationen überhaupt möglich ist. Diese (Venn-) Diagramme der Bevölkerung und ihrer Untergruppen machen dies deutlich.


3
Unter der Annahme, dass Blutgruppe und Haarlänge unabhängig voneinander sind, sollte der Anteil langhaariger Frauen mit Typ AX3 mit dem Anteil kurzhaariger Frauen mit AX3 identisch sein. Dh Sie haben nicht die Flexibilität, Rechtecke in der von Ihnen vorgeschlagenen Weise zu verschieben ... Wenn wir auch annehmen, dass Männer und Frauen 50:50 in der gesamten Bevölkerung sind, gibt uns das nicht genug Informationen, um diese Frage mit einer einzigen zu lösen unbestreitbare Antwort?
Wahrscheinlich

@whuber +1 sehr schön.
Michael R. Chernick

5
ProbablyWrong, werfen Sie einen genauen Blick auf die Frage in Ihrem Kommentar: weil sie mit beschäftigt Frauen , eine zusätzliche Annahme über die Unabhängigkeit macht bedingter des Geschlechts. Die Annahme der (bedingungslosen) Unabhängigkeit von Haar und Blutgruppe erwähnt das Geschlecht überhaupt nicht. Um zu verstehen, was es bedeutet, streichen Sie die Schraffur aus den Zahlen. Dies zeigt hoffentlich, warum wir die Flexibilität haben, die Schraffur innerhalb des oberen und unteren Rechtecks ​​beliebig anzuordnen.
Whuber

1
@whuber, das gefällt mir. Ich habe jedoch 2 Fragen / Erläuterungen: 1. Die Zahlen scheinen ein Populationsverhältnis zwischen langem und kurzem Haar (ungefähr 6: 4) und AX3 und AX3 (ungefähr 85:15) anzunehmen, aber dies wird in der ursprünglichen Frage nicht erwähnt noch in Ihren Erläuterungen zu den Figuren besprochen. Ich vermute, dass die Pop-Proportionen nicht relevant sind. Habe ich recht / könntest du das in den Erklärungen klarstellen? 2. Ich denke, diese Situation funktioniert letztendlich mit demselben Phänomen wie Simpsons Paradoxon , nur anders gerahmt (sozusagen aus der anderen Richtung). Ist das eine faire Einschätzung?
gung - Wiedereinsetzung von Monica

3
@gung, danke für die Klarstellung. Die Zahlen müssen natürlich einige Proportionen darstellen, um überhaupt funktionieren zu können, aber alle Proportionen, die nicht speziell in der Problemstellung festgehalten sind, können variieren. (Ich habe die Figur so konstruiert, dass ungefähr 50% der Bevölkerung weiblich erscheint, was auf eine spätere Bearbeitung hindeutet, in der dies angenommen wurde.) Die Idee, diese grafische Darstellung zum Verständnis von Simpsons Paradox anzuwenden, ist faszinierend; Ich denke, dass es Verdienst hat.
Whuber

13

Dies ist eine Frage der bedingten Wahrscheinlichkeit. Sie wissen, dass die Person lange Haare und Blutgruppe Ax3 hat. Lassen Sie Also suchst du . Sie wissen, dass und . Reicht das aus, um zu berechnenP ( C | A und B ) , P ( C | A ) = 0,9 P ( C | B ) = 0,8 P ( C | A und B ) ? Angenommen, P ( A und B und C ) = 0,7 . Dann P ( C | A und B

     A={'The person has long hair'}              B={'The person has blood type Ax3'}C={'The person is female'}.

P(C|A and B)P(C|A)=0.9P(C|B)=0.8
P(C|A and B)P(A and B and C)=0.7 Angenommen, P ( A und B ) = 0,8 . Dann ist P ( C | A und B ) = 0,875 . Andererseits, wenn P ( A und B ) =
P(C|A and B)=P(A and B and C)/P(A and B)=0.7/P(A and B).
P(A and B)=0.8P(C|A and B)=0.875 wir dann P ( C | A und B ) = 0,78.P(A and B)=0.9P(C|A and B)

Jetzt sind beide möglich, wenn und P ( C | B ) = 0,8 ist . Wir können also nicht genau sagen, was P ( C | A und B ) ist.P(C|A)=0.9P(C|B)=0.8P(C|A and B)


Hallo Michael, wenn ich dich richtig lese, sagst du, dass die gestellte Frage nicht beantwortet werden kann, ist das richtig? Oder anders ausgedrückt, Sie benötigen weitere Informationen, um diese Frage zu beantworten? 1. Nehmen wir an, dass die seltene Blutgruppe in meiner ursprünglichen Frage keinen Einfluss auf den Wunsch oder die Fähigkeit einer Person hat, ihr Haar lang wachsen zu lassen. Kann die Frage jetzt beantwortet werden? 2. Würden Sie zustimmen, dass die Antwort größer als 0,9 sein muss? (Weil Sie eine zweite unabhängige Information haben - die Blutgruppe -, die die Hypothese bestätigt, dass die Person eine Frau ist)
Wahrscheinlich

2
Wenn unabhängig ist, dann ist P ( A  und  B ) = P ( A ) P ( B ) und Sie müssen angeben, welcher Anteil der Personen lange Haare hat, dh P ( A ) und welcher Anteil der Personen haben die Blutgruppe Ax3, dh P ( B ) . Sie können auch nicht sagen, dass die Antwort größer als 0,9 sein muss, was der Aussage entspricht, dass P ( C | A  und  B )P(A and B)P(A and B)=P(A)P(B)P(A)P(B) (ich verstehe wirklich nicht warum). P(C|A and B)>0.9
Néstor

2
@ Wahrscheinlich falsch. Ja, das eingangs genannte Problem enthält nicht genügend Informationen für eine eindeutige Antwort.
Michael R. Chernick

@ Néstor, Micahael, ich bin nicht einverstanden, dass wir wissen müssen, welche Fraktion von Personen lange Haare hat oder welche Fraktion von Personen die Blutgruppe AX3 hat. Ich denke, die Antwort auf die ursprüngliche Frage wird eindeutig geklärt, ohne diese zu kennen (vorausgesetzt, A und B sind unabhängig, was wir alle haben, und vorausgesetzt, wir kennen die Spaltung von Männern und Frauen in der gesamten Bevölkerung - nicht unangemessen anzunehmen, dass das etwa 50:50 ist , Ich glaube).
Wahrscheinlich

7
P(C|A and B)=P(A and B and C)×P(A and B)??
P(C|AB)=P(C(AB))P(AB)=P(ABC)P(AB)

4

Faszinierende Diskussion! Ich frage mich, ob wir P (A) und P (B) auch spezifiziert haben, ob die Bereiche von P (C | A, B) nicht viel enger als das volle Intervall [0,1] sein werden, einfach wegen der vielen Einschränkungen wir haben.

Halten Sie sich an die oben eingeführte Notation:

A = der Fall, dass die Person lange Haare hat

B = das Ereignis, dass die Person die Blutgruppe AX3 hat

C = das Ereignis, dass diese Person weiblich ist

P (C | A) = 0,9

P (C | B) = 0,8

P (C) = 0,5 (dh nehmen wir ein gleiches Verhältnis von Männern und Frauen in der Gesamtbevölkerung an)

P(AB|C)=P(A|C)P(B|C)=P(C|A)P(A)P(C)P(C|B)P(B)P(C)

dann

P(C|AB)=P(AB|C)(P(C)P(AB))=P(C|A)P(A)P(C)P(C|B)P(B)P(C)(P(C)P(AB))

P(AB)=P(A)P(B)

P(C|AB)=P(C|A)P(C|B)P(C)=0.90.80.5>1

P(C|AB)[0,1]P(A)P(B)P(A)P(B)

P(C|AB)

P(C|A)=0.9

P(C)=0.5

P(C|B)=0.8

4. (trivial) Das obere Rechteck kann nicht über die linke Grenze hinaus verschoben werden und sollte nicht über seine minimale Überlappung nach links hinaus verschoben werden.

5. (trivial) Das untere Rechteck kann nicht über die rechte Grenze hinaus verschoben werden und sollte nicht über seine maximale Überlappung nach rechts hinaus verschoben werden.

P(C|AB)Bildbeschreibung hier eingeben

Durch Durchlaufen eines Bereichs möglicher Werte für P (A) und P (B) ( R-Skript ) wird dieses Diagramm generiert Bildbeschreibung hier eingeben

Abschließend können wir die bedingte Wahrscheinlichkeit P (c | A, B) für gegebene P (A), P (B) senken


2
A,B,C

1
@whuber: danke für den nützlichen kommentar! Ich hoffe, die neuen Änderungen machen es lesbarer und klarer.
Markus Loecher

@whuber und andere: Ich hatte gehofft, die Diskussion wiederzubeleben, aber der Thread scheint inaktiv geworden zu sein? Keine weiteren Kommentare von irgendjemandem?
Markus Loecher

1

Die Hypothese lautet, dass die Person hinter einem Vorhang eine Frau ist.

Wir haben 2 Beweise vorgelegt, nämlich:

Beweis 1: Wir wissen, dass die Person lange Haare hat (und uns wurde gesagt, dass 90% aller Menschen mit langen Haaren weiblich sind)

Beweis 2: Wir wissen, dass die Person eine seltene Blutgruppe AX3 hat (und es wird berichtet, dass 80% aller Menschen mit dieser Blutgruppe weiblich sind)

Ausgehend von Beweis 1 können wir sagen, dass die Person hinter einem Vorhang mit einer Wahrscheinlichkeit von 0,9 eine Frau ist (unter der Annahme einer Aufteilung von 50:50 zwischen Männern und Frauen).

In Bezug auf die Frage, die zuvor im Thread gestellt wurde, nämlich "Würden Sie zustimmen, dass die Antwort GRÖSSER als 0,9 sein muss?", Würde ich intuitiv sagen, dass die Antwort "Ja" sein muss (sie ist GRÖSSER als 0,9). Die Logik ist, dass Evidence 2 Beweise stützt (wiederum unter der Annahme eines 50: 50-Spalts für die Anzahl der Männer und Frauen in der Welt). Wenn wir erfahren würden, dass 50% aller Menschen mit AX3-Blut weiblich sind, wäre Evidence 2 neutral und ohne Bedeutung. Aber da uns gesagt wird, dass 80% aller Menschen mit dieser Blutgruppe weiblich sind, stützt Evidence 2 Beweise und sollte logischerweise die endgültige Wahrscheinlichkeit einer Frau über 0,9 hinausschieben.

Um eine bestimmte Wahrscheinlichkeit zu berechnen, können wir die Bayes-Regel für Evidence 1 anwenden und dann die Bayes-Aktualisierung verwenden, um Evidence 2 auf die neue Hypothese anzuwenden.

Annehmen:

A = der Fall, dass die Person lange Haare hat

B = das Ereignis, dass die Person die Blutgruppe AX3 hat

C = das Ereignis, dass die Person weiblich ist (50% annehmen)

Anwenden der Bayes-Regel auf Beweis 1:

P (C | A) = (P (A | C) · P (C)) / P (A)

Auch in diesem Fall, wenn wir eine Aufteilung von 50:50 zwischen Männern und Frauen annehmen:

P (A) = (0,5 × 0,9) + (0,5 × 0,1) = 0,5

Also, P (C | A) = (0,9 * 0,5) / 0,5 = 0,9 (Nicht überraschend, aber es wäre anders, wenn wir nicht eine Aufteilung von 50:50 zwischen Männern und Frauen hätten.)

Unter Verwendung der Bayes'schen Aktualisierung, um Evidence 2 anzuwenden und 0.9 als neue vorherige Wahrscheinlichkeit einzufügen, haben wir:

P (C | A UND B) = (P (B | C) * 0,9) / P (E)

Hier ist P (E) die Wahrscheinlichkeit für Evidenz 2 unter der Annahme, dass die Person bereits eine 90% ige Chance hat, weiblich zu sein.

P (E) = (0,9 * 0,8) + (0,1 * 0,2) [Dies ist das Gesetz der Gesamtwahrscheinlichkeit: (P (Frau) * P (AX3 | Frau) + P (Mann) * P (AX3 | Mann)] Also , P (E) = 0,74

Also ist P (C | A UND B) = (0,8 × 0,9) / 0,74 = 0,97297


1
In Ihrer Antwort sind einige Aussagen enthalten, die für mich keinen Sinn ergeben. (1) P (C | A) = 0,9 nach Annahme. Nirgendwo hieß es, dass P (C) = 0,9 sei. Wir gingen von P (C) = 0,5 aus. (2) Wie haben Sie das Ergebnis für P (E) erhalten? P (Frau) = P (Mann) = 0,5 nach der Annahme, dass Sie P (Frau) = 0,9 schreiben.
Michael R. Chernick

Der Wert von P (C) wird mit 0,5 angenommen, was ich verwendet habe. Der Wert für P (E) ist die Wahrscheinlichkeit von Evidence 2 nach Anwendung von Evidence 1 (was zu einer neuen Hypothese führt, dass die Wahrscheinlichkeit, dass die Person weiblich ist, 0,9 beträgt). P (E) = (Wahrscheinlichkeit, dass die Person eine Frau ist (Evidence 1 gegeben) * Wahrscheinlichkeit, dass die Person AX3 hat, wenn eine Frau) + (Wahrscheinlichkeit, dass die Person ein Mann ist (Evidence 1 gegeben) * Wahrscheinlichkeit, dass die Person AX3 hat wenn ein Mann) = (0,9 * 0,8) + (0,1 * 0,2) = 0,74
RandomAnswer

Ihre Definition der Wahrscheinlichkeit von E ist etwas verwirrend und die Begriffe, die Sie zur Berechnung verwenden, sehen anders aus als die, die Sie zuvor geschrieben haben. Es ist aber wirklich egal. Die Antwort ist anscheinend richtig, basierend auf Huus schön präsentierter Antwort.
Michael R. Chernick

@Michael Außer es scheint, dass Huu Fehler gemacht hat.
whuber

2
Diese Antwort ist einfach falsch. Es mag andere Fehler geben, aber dieser ist grell. Sie geben eine endgültige Antwort für P ("Hat langes Haar") (Ihr P (A)) an und geben dann Ihre endgültige endgültige Antwort. Es gibt einfach nicht genug Informationen, um dies zu bestimmen, selbst wenn P (F) = 0,5 angenommen wird. Ihre Linie zur Berechnung von P (A) scheint aus dem Nichts zu kommen. Hier ist die korrekte Formel unter Verwendung von Bayes-Theroem: P (A) = P (A | F) P (F) / P (F | A), aus der unter Verwendung Ihrer angegebenen Annahmen P (A) = P (A | F) * 5/9. Wir wissen jedoch immer noch nicht, ob P (A | F) etwas ist oder nicht.
Bogdanovist

0

Fragenanpassung und Verallgemeinerung

ABC01ZiZi(X|Y)XY(Aa|BbCcI)

  1. (Aa1|Bb1I)=u1(Aa2|Cc2I)=u2
  2. (Aa1|Bb1I)=u1(Aa2|Cc2I)=u2(BC|I)=(B|I)(C|I)
  3. (Aa1|Bb1I)=u1(Aa2|Cc2I)=u2(A0|I)=12
  4. (Aa1|Bb1I)=u1(Aa2|Cc2I)=u2(A0|I)=12(BC|I)=(B|I)(C|I)

I

(BjCk|I)=(Bj|I)(Ck|I),j=0,1k=0,1

Antworten

Fall 1

(ABC|I)(ABC|I)

Es wurde durch verschiedene esoterische Mittel gezeigt, dass die zuzuweisende Verteilung, wenn die Informationen keine andere Lösung bestimmen, diejenige ist, die von allen mit den bekannten Informationen konsistenten Verteilungen die größte Entropie aufweist. Jede andere Verbreitung impliziert, dass wir mehr wissen als die bekannten Informationen, was natürlich ein Widerspruch ist.

i,j,k(AiBjCk|I)ln(AiBjCk|I)
i,j,k(AiBjCk|I)=1
(Aa1|Bb1I)=u1i.e.k(Aa1Bb1Ck|I)i,k(AiBb1Ck|I)=u1
(Aa2|Cc2I)=u2i.e.j(Aa2BjCc2|I)i,j(AiBjCc2|I)=u2

  1. A1
  2. B1
  3. C1

a=1b=1c=1a1=1b1=1a2=1c2=1u1=0.9u2=0.8(A1|B1C1I)0.932. Daher beträgt die Wahrscheinlichkeit, dass die Person hinter dem Vorhang weiblich ist, angesichts der langen Haare und der Blutgruppe AX3, 0,932.

Fall 2

BC

(B0|ClI)=(B0|I),l=0,1
i(AiB0Cl|I)i,j(AiBjCl|I)=i,k(AiB0Ck|I),l=0,1
(A1|B1C1I)0.936

Fall 3

(A0|I)=12i.e.j,k(A0BjCk|I)=12
(A1|B1C1I)0.973

Fall 4

(A1|B1C1I)0.989


-2

Ich glaube jetzt, dass, wenn wir ein Verhältnis von Männern und Frauen in der Gesamtbevölkerung annehmen, es eine einzige unbestreitbare Antwort gibt.

A = der Fall, dass die Person lange Haare hat

B = das Ereignis, dass die Person die Blutgruppe AX3 hat

C = das Ereignis, dass diese Person weiblich ist

P (C | A) = 0,9

P (C | B) = 0,8

P (C) = 0,5 (dh nehmen wir ein gleiches Verhältnis von Männern und Frauen in der Gesamtbevölkerung an)

Dann ist P (C | A und B) = [P (C | A) × P (C | B) / P (C)] / [P (C | A) × P (C | B) / P (C )] + [[1-P (C | A)] x [1-P (C | B)] / [1-P (C)]]

in diesem Fall ist P (C | A und B) = 0,972973


P [C | A und B) = P (A und B und C) / P (A und B) = P (A und B und C) / [P (A | B) P (B)]. Wie bist du auf deine Formel gekommen?
Michael R. Chernick

Es gibt wahrscheinlich eine Möglichkeit, Bedingungen hinzuzufügen, damit Sie eine eindeutige Antwort erhalten.
Michael R. Chernick

Durch Addition von A und B vereinfacht sich die Formel zu P (A und B und C) / [P (A) P (B)] = P (B und C | A) / P (B).
Michael R. Chernick

2
Die Absicht meiner Frage war wirklich, dass Sie die Formel rechtfertigen. Ich verstehe nicht, wie es abgeleitet werden würde.
Michael R. Chernick

2
Nein, die Antwort, die angeblich die Bayes-Regel verwendet hat, ist falsch. Ich bin mir nicht sicher, warum Sie verwirrt sind. Die obige Formel von MC ist korrekt und kann nicht verwendet werden, um ein Ergebnis zu erzielen. Dies sind seine und Whubers Antworten auf die erklärte Frage!
Bogdanovist

-2

Hinweis: Um eine endgültige Antwort zu erhalten, gehen die folgenden Antworten davon aus, dass die Wahrscheinlichkeit, dass eine Person, ein langhaariger Mann und eine langhaarige Frau AX3 haben, ungefähr gleich ist. Wenn mehr Genauigkeit gewünscht wird, sollte dies überprüft werden.

Sie beginnen mit dem Wissen, dass die Person lange Haare hat. Zu diesem Zeitpunkt sind die Chancen also:

90:10

Hinweis: Das Verhältnis von Männern zu Frauen in der Allgemeinbevölkerung spielt für uns keine Rolle, sobald wir feststellen, dass die Person lange Haare hat. Wenn zum Beispiel 1 von 100 Frauen in der Allgemeinbevölkerung leben würde, wäre eine zufällig ausgewählte langhaarige Person immer noch zu 90% weiblich. Das Verhältnis von Frauen zu Männern spielt eine Rolle! (Einzelheiten finden Sie im Update weiter unten.)

Als nächstes erfahren wir, dass die Person AX3 hat. Da AX3 nichts mit langen Haaren zu tun hat, beträgt das Verhältnis von Männern zu Frauen bekanntermaßen 50:50. Da wir davon ausgehen, dass die Wahrscheinlichkeiten gleich sind, können wir einfach jede Seite der Wahrscheinlichkeit multiplizieren und so normalisieren, dass sich die Summe aus ergibt Die Seiten der Wahrscheinlichkeit sind gleich 100:

(90:10) * (80:20)
==> 7200:200

    Normalize by dividing each side by (7200+200)/100 = 74

==> 7200/74:200/74
==> 97.297.. : 2.702..

Somit liegt die Wahrscheinlichkeit, dass die Person hinter dem Vorhang weiblich ist, bei etwa 97,297%.

AKTUALISIEREN

Hier ist eine weitere Untersuchung des Problems:

Definitionen:

f - number of females
m - number of males
fl - number of females with long hair
ml - number of males with long hair
fx - number of females with AX3
mx - number of males with AX3
flx - number of females with long hair and AX3
mlx - number of males with long hair and AX3
pfl - probability that a female has long hair
pml - probability that a male has long hair
pfx - probability that a female has AX3
pmx - probability that a male has AX3

Zunächst wird uns mitgeteilt, dass 90% der langhaarigen Menschen weiblich sind und 80% der Menschen mit AX3 weiblich.

fl = 9 * ml
pfl = fl / f
pml = ml / m 
    = fl / (9 * m)

fx = 4 * mx
pfx = fx / f
pmx = mx / m 
    = fx / (4 * m)

Da wir davon ausgegangen sind, dass die Wahrscheinlichkeit von AX3 unabhängig von Geschlecht und langem Haar ist, gilt unser berechneter pfx für Frauen mit langem Haar, und pmx gilt für Männer mit langem Haar, um die Anzahl von ihnen zu ermitteln, die wahrscheinlich AX3 haben:

flx = fl * pfx 
    = fl * (fx / f) 
    = (fl * fx) / f
mlx = ml * pmx 
    = (fl / 9) * (fx / (4 * m)) 
    = (fl * fx) / (36 * m)

Somit ist das wahrscheinliche Verhältnis der Anzahl von Frauen mit langen Haaren und AX3 zur Anzahl von Männern mit langen Haaren und AX3:

flx             :   mlx
(fl * fx) / f   :   (fl * fx) / (36 * m)
1/f             :   1 / (36m)
36m             :   f

Da vorausgesetzt wird, dass es eine gleiche Anzahl von 50:50 gibt, können Sie beide Seiten stornieren und mit 36 ​​Frauen für jeden Mann enden. Ansonsten gibt es 36 * m / w Frauen für jeden Mann in der angegebenen Untergruppe. Wenn es beispielsweise doppelt so viele Frauen wie Männer gäbe, würde jeder Mann mit langen Haaren und AX3 72 Frauen haben.


1
Diese Lösung beruht auf der Annahme, dass mehr als derzeit im Problem angegeben ist: Langes Haar, AX3 und Geschlecht sind unabhängig. Sie können aber nicht rechtfertigen pfx für Frauen mit langen Haaren „Anwendung“, usw.
whuber

@whuber: Ja, ich gehe davon aus. Ist es nicht der Zweck der Wahrscheinlichkeit, basierend auf Ihren Daten die beste Annäherung zu treffen? Da Sie also bereits wissen, dass Langhaar und AX3 für die allgemeine Bevölkerung unabhängig sind, sollten Sie diese Annahme auf Männer und Frauen übertragen, bis Sie ausdrücklich etwas anderes lernen. Zugegeben, es ist nicht universell korrekt, aber es ist das Beste, was Sie machen können, bis Sie weitere Informationen erhalten. F: Wenn Sie nur mit den aktuellen Daten die% Chance geben müssten, dass es eine Frau hinter dem Vorhang ist, würden Sie dann wirklich "zwischen 0 und 100%" sagen?
Briguy37

1
Wir haben einen wichtigen Unterschied in der Philosophie, @Briguy. Ich bin fest davon überzeugt, keine unbegründeten Annahmen zu treffen. Es ist nicht klar, in welchem ​​Sinne die Annahme der gegenseitigen Unabhängigkeit "am besten" ist: Ich werde es in bestimmten Anwendungen gewähren. Aber im Allgemeinen scheint mir das gefährlich zu sein. Ich würde es vorziehen, klar über die Annahmen zu sein, die zur Lösung eines Problems erforderlich sind, damit die Leute entscheiden können, ob es sich lohnt, die Daten zu sammeln, um diese Annahmen zu überprüfen, anstatt Dinge anzunehmen, die mathematisch zweckmäßig sind, um eine Antwort zu erhalten. Das ist der Unterschied zwischen Statistik und Mathematik.
whuber

Um Ihre Frage zu beantworten: Ja, 0% - 100% ist genau die Antwort, die ich geben würde. (Ich habe auf dieser Website ähnliche Antworten auf vergleichbare Fragen gegeben.) Dieser Bereich spiegelt die Unsicherheit genau wider. Dieses Problem ist eng mit dem Ellsberg-Paradox verwandt . Das Original von Ellsberg ist gut geschrieben und klar: Ich empfehle es.
whuber

@whuber: Danke, dass du dir die Zeit für den Dialog mit mir genommen hast. Ich verstehe, wie wichtig es ist, die getroffenen Annahmen zu überdenken und aufzulisten, und habe meine Antwort entsprechend aktualisiert. In Bezug auf Ihre Antwort halte ich sie jedoch für unvollständig. Der Grund dafür ist, dass Sie alle unbekannten Fälle berücksichtigen und die durchschnittliche Wahrscheinlichkeit ermitteln können, dass alle Fälle zu Ihrer endgültigen Antwort führen. EG Obwohl beides immer noch möglich ist, sind Wahrscheinlichkeiten über 50% in allen Fällen weitaus häufiger als Wahrscheinlichkeiten unter 50%. Daher raten wir mit Sicherheit besser davon ab, dass es sich um eine Frau handelt.
Briguy37

-4

98% weiblich, einfache Interpolation. Erste Prämisse 90% weiblich, verlässt 10%, zweite Prämisse verlässt nur 2% der bestehenden 10%, also 98% weiblich

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.