Angenommen, eine bestimmte Krankheit ( ) hat eine Prävalenz von . Nehmen wir auch an, dass ein bestimmtes Symptom ( ) eine Prävalenz (in der Allgemeinbevölkerung = Menschen mit dieser Krankheit D und Menschen ohne diese Krankheit [wahrscheinlich mit einer anderen Krankheit, aber nicht wichtig]) von . In einer früheren Untersuchung wurde entdeckt, dass die bedingte Wahrscheinlichkeit (die Wahrscheinlichkeit, das Symptom zu haben , wenn die Krankheit beträgt ).3 S.S D 30 %
Erste Frage : Könnte als äquivalent zur Prävalenz des Symptoms in der Gruppe der Menschen mit der Krankheit interpretiert werden ?S D
Zweite Frage : Ich möchte in R einen Datensatz erstellen, der Folgendes zeigt:
P(D|S)=0.18SD18%
Wie macht man das? Wenn ich einfach die sample
Funktion verwende, fehlen in meinem Datensatz die Informationen, dass :
symptom <- sample(c("yes","no"), 1000, prob=c(0.005, 0.995), rep=T)
disease <- sample(c("yes","no"), 1000, prob=c(0.002, 0.998), rep=T)
Meine Frage lautet also: Wie erstelle ich einen guten Datensatz, einschließlich der von mir gewünschten bedingten Wahrscheinlichkeit?
BEARBEITEN : Ich habe die gleiche Frage auch auf stackoverflow.com ( /programming/7291935/how-to-create-a-dataset-with-conditional-probability ) gepostet , weil meiner Meinung nach meine Frage wird an das R-Sprachprogramm, aber auch an die statistische Theorie vererbt.