Stellen Sie sich folgendes Setup vor: Sie haben 2 Münzen, Münze A, die garantiert fair ist, und Münze B, die fair sein kann oder nicht. Sie werden aufgefordert, 100 Münzen zu werfen, und Ihr Ziel ist es, die Anzahl der Köpfe zu maximieren .
Ihre vorherige Information über Münze B ist, dass sie dreimal geworfen wurde und 1 Kopf ergab. Wenn Ihre Entscheidungsregel lediglich auf dem Vergleich der erwarteten Wahrscheinlichkeit der Köpfe der 2 Münzen basiert, würden Sie die Münze A 100-mal werfen und damit fertig sein. Dies gilt auch dann, wenn vernünftige Bayes'sche Schätzungen (hintere Mittelwerte) der Wahrscheinlichkeiten verwendet werden, da Sie keinen Grund zu der Annahme haben, dass Münze B mehr Köpfe ergibt.
Was ist jedoch, wenn die Münze B tatsächlich zugunsten der Köpfe voreingenommen ist? Sicherlich sind die "potentiellen Köpfe", die Sie aufgeben, wenn Sie die Münze B ein paarmal umwerfen (und damit Informationen über ihre statistischen Eigenschaften erhalten), in gewisser Weise wertvoll und fließen daher in Ihre Entscheidung ein. Wie kann dieser "Informationswert" mathematisch beschrieben werden?
Frage: Wie konstruieren Sie in diesem Szenario mathematisch eine optimale Entscheidungsregel?