Antworten:
Möchten Sie, dass die Proportionen in der Stichprobe genau den angegebenen Proportionen entsprechen? oder um die Idee der Stichprobe aus einer sehr großen Population mit diesen Anteilen darzustellen (so dass die Stichprobenanteile nahe beieinander liegen, aber nicht genau sind)?
Wenn Sie die genauen Proportionen wünschen, können Sie Brandons Vorschlag folgen und die R- sample
Funktion verwenden, um die Reihenfolge eines Vektors mit den genauen Proportionen zufällig zu bestimmen.
Wenn Sie eine Stichprobe aus der Grundgesamtheit erstellen möchten, aber die Proportionen nicht genau einschränken möchten, können Sie die sample
Funktion in R weiterhin mit dem folgenden prob
Argument verwenden:
> x <- sample( LETTERS[1:4], 10000, replace=TRUE, prob=c(0.1, 0.2, 0.65, 0.05) )
> prop.table(table(x))
x
A B C D
0.0965 0.1972 0.6544 0.0519
Verwenden von R (http://cran.r-project.org/). Ich erstelle hier nur eine zufällige Liste mit den von Ihnen angegebenen Proportionen.
x <- c(rep("A",0.1*10000),rep("B",0.2*10000),rep("C",0.65*10000),rep("D",0.05*10000))
# cheating
x <- sample(x, 10000)
prop.table(summary(as.factor(x)))
/ me Wartet geduldig auf Streit darüber, wie zufällig dies ist
n <- 10000
blah <- character(n)
u <- runif(n)
blah[u<=0.1] <- "A"
blah[u>0.1 & u<=0.3] <- "B"
blah[u>0.3 & u<=0.95] <- "C"
blah[u>0.95] <- "D"
table(blah)
prop.table(summary(as.factor(blah)))
Ich habe keinen Zweifel, dass dies wirklich zufällig ist. Ich meine, soweit das runif()
zufällig ist :)
prob
Argument zu verwenden für sample()
:sample(LETTERS[1:4], 10000, replace=TRUE, prob=c(0.1, 0.2, 0.65, 0.05))
Wenn Sie ein SAS-Benutzer sind, bieten neuere Versionen eine ähnliche Möglichkeit, aus einer sogenannten "Tabellen" -Distribution zu ziehen - nach der Sie als Teil der Rand () - Funktion suchen. Siehe http://support.sas.com/documentation/cdl/en/lrdict/64316/HTML/default/viewer.htm#a001466748.htm
x <- rep( c("A","B","C","D"), 10000*c(0.1,0.2,0.65,0.05) )
und müssen nicht 10000 im Aufruf zum Abtasten angeben. Dies wäre die Standardeinstellung (aus Gründen der Übersichtlichkeit schadet es jedoch nicht, sie anzugeben).