Angenommen, Sie möchten von 8 bis 20 Uhr am nahe gelegenen See angeln. Aufgrund von Überfischung wurde ein Gesetz eingeführt, das besagt, dass Sie nur einen Fisch pro Tag fangen dürfen. Wenn Sie einen Fisch fangen, können Sie ihn entweder behalten (und damit mit diesem Fisch nach Hause gehen) oder ihn zurück in den See werfen und weiter fischen (aber riskieren Sie, sich später mit einem kleineren Fisch oder gar keinem Fisch niederzulassen). Sie möchten einen möglichst großen Fisch fangen. Insbesondere möchten Sie die erwartete Fischmasse maximieren, die Sie nach Hause bringen.
Formal könnten wir dieses Problem wie folgt einrichten: Fische werden mit einer bestimmten Geschwindigkeit gefangen (die Zeit, die zum Fangen Ihres nächsten Fisches benötigt wird, folgt also einer bekannten Exponentialverteilung), und die Größe der gefangenen Fische folgt einer gewissen (auch bekannten) Verteilung . Wir wollen einen Entscheidungsprozess, der angesichts der aktuellen Zeit und der Größe eines gerade gefangenen Fisches entscheidet, ob der Fisch behalten oder zurückgeworfen wird.
Die Frage ist also: Wie soll diese Entscheidung getroffen werden? Gibt es eine einfache (oder komplizierte) Möglichkeit zu entscheiden, wann das Fischen eingestellt werden soll? Ich denke, das Problem ist gleichbedeutend damit, für eine gegebene Zeit t zu bestimmen, welche erwartete Fischmasse ein optimaler Fischer mit nach Hause nehmen würde, wenn er zum Zeitpunkt t beginnen würde; Der optimale Entscheidungsprozess würde einen Fisch genau dann halten, wenn der Fisch schwerer als die erwartete Masse ist. Aber das scheint irgendwie selbstreferenziell zu sein; Wir definieren die optimale Fangstrategie im Hinblick auf einen optimalen Fischer, und ich bin mir nicht ganz sicher, wie ich vorgehen soll.