Beginnen wir mit dem Zeichnen der Daten und werfen einen Blick darauf. Dies ist eine sehr begrenzte Datenmenge, daher wird dies mit vielen Annahmen etwas ad hoc sein .
rotten <- c(0,1,1,0,0,0,1,1,1,1,0,0,0)
rotten <- as.factor(rotten)
mass <- c(139.08,
91.48,
74.23,
129.8,
169.22,
123.43,
104.93,
103.27,
169.01,
83.29,
157.57,
117.72,
128.63)
diam <- c(17.28,
6.57,
7.12,
16.52,
14.58,
6.99,
6.63,
6.75,
15.38,
7.45,
13.06,
6.61,
7.19)
plot(mass,diam,col=rotten,lwd=2)
title("Fruits")
Das sind also die Daten, rote Punkte stehen für faule Früchte:

Sie gehen zu Recht davon aus, dass es zwei Arten von Früchten zu geben scheint. Die Annahmen, die ich mache, sind die folgenden:
- Der Durchmesser teilt die Früchte in zwei Gruppen
- Früchte mit einem Durchmesser von mehr als 10 gehören zu einer Gruppe, andere zur kleineren Gruppe.
- Es gibt nur eine faule Frucht in der großen Fruchtgruppe. Nehmen wir an, wenn eine Frucht in der großen Gruppe ist, hat das Fäulnis keinen Einfluss auf das Gewicht. Dies ist wichtig, da wir nur einen Datenpunkt in dieser Gruppe haben.
- Wenn die Frucht eine kleine Frucht ist, wirkt sich Fäulnis auf die Masse aus.
- Nehmen wir an, dass die Variablen diam und mass normal verteilt sind.
Da die Summe des Durchmessers 64,2 cm beträgt, sind höchstwahrscheinlich zwei Früchte groß und vier klein. Jetzt gibt es 3 Fälle für das Gewicht. Es gibt 2, 3 oder 4 kleine Früchte, die faul sind ( eine große Frucht, die faul ist, beeinflusst die Masse nicht durch Annahme ). Jetzt können Sie Grenzen für Ihre Masse ermitteln, indem Sie diese Werte berechnen.
Wir können empirisch die Wahrscheinlichkeit abschätzen, dass die Anzahl der kleinen Früchte verfault ist. Wir verwenden die Wahrscheinlichkeiten, um unsere Schätzungen der Masse in Abhängigkeit von der Anzahl der faulen Früchte zu gewichten:
samps <- 100000
stored_vals <- matrix(0,samps,2)
for(i in 1:samps){
numF <- 0 # Number of small rotten
numR <- 0 # Total number of rotten
# Pick 4 small fruits
for(j in 1:4){
if(runif(1) < (5/8)){ # Empirical proportion of small rotten
numF <- numF + 1
numR <- numR + 1
}
}
# Pick 2 large fruits
for(j in 1:2){
if(runif(1) < 1/5){# Empirical proportion of large rotten
numR <- numR + 1
}
}
stored_vals[i,] <- c(numF,numR)
}
# Pick out samples that had 4 rotten
fourRotten <- stored_vals[stored_vals[,2] == 4,1]
hist(fourRotten)
table(fourRotten)
# Proportions
props <- table(fourRotten)/length(fourRotten)
massBig <- mean(mass[diam>10])
massSmRot <- mean(mass[diam<10 & rotten == 1])
massSmOk <- mean(mass[diam<10 & rotten == 0])
weights <- 2*massBig + c(2*massSmOk+2*massSmRot,1*massSmOk+3*massSmRot,4*massSmRot)
Est_Mass <- sum(props*weights)
Geben Sie uns eine endgültige Schätzung von 691,5183 g . Ich denke, Sie müssen die meisten Annahmen treffen, die ich getroffen habe, um zu einer Schlussfolgerung zu gelangen, aber ich denke, es könnte möglich sein, dies auf intelligentere Weise zu tun. Außerdem probiere ich empirisch, um die Wahrscheinlichkeit der Anzahl fauler kleiner Früchte zu ermitteln, das ist nur Faulheit und kann "analytisch" durchgeführt werden.