Es gibt einige geringfügige Sprachfehler, die zu Verwirrung bei Ihrer Frage führen.
Aber warum sollten wir so argumentieren? Mit jeder Entscheidung ist tatsächlich eine Verteilung des Nutzens verbunden. Warum vergleichen wir die Verteilungen von Dienstprogrammen für verschiedene Auswahlmöglichkeiten nur anhand einer einzigen zusammenfassenden Statistik? Und warum wählen wir eher den Mittelwert als den Modus oder den Median usw.?
Dienstprogramme haben keine Verteilung. Ergebnisse haben eine Verteilung und über das Ergebnis haben Aktionen in einigen Fällen eine Verteilung. Der Nutzen ist deterministisch. Wenn es zufällig wäre, würden Sie Ihre Gefühle in Bezug auf ein Ergebnis ständig erschrecken. Zum Beispiel könnten Sie die Erfahrung machen, "Wow, meine Beine bei einem Autounfall gequetscht zu haben, war eine überraschend gute Erfahrung!" Was ungewiss ist, ist das Ergebnis einer Aktion.
Wenn wir entartete Fälle ausschließen, in denen die Integrale divergieren und keine Lösung existiert, kann ich Ihnen auch einen Fall zeigen, in dem der Median den erwarteten Nutzen maximiert.
Beachten Sie, dass U.( δ( x ) , μ ) = - L ( δ( x ) , μ ). Wir finden es wichtig, eine Regel zu erstellen, die wir mit unserem Dienstprogramm bewerten und die wir finden werdenμ mit einiger Konsistenz.
Wir wollen lösen: MindestδL (δ, μ ) = | δ( x ) - μ |
vorbehaltlich f( x | μ ) =1π11 + ( x - μ)2.
Wenn wir das annehmen Pr ( μ ) ≤ 1 , dann ist das Risiko ∫∞- ∞| δ( x ) - μ |∏i = 1n1π11 + (xich- μ)2d x
und das integrierte Risiko minimiert wann ∫∞- ∞∫∞- ∞| δ( x ) - μ |∏i = 1n1π11 + (xich- μ)2d x d μ
ist auf einem Minimum. Es minimiert wannδ( x ) ist der Median.
Sie maximieren den erwarteten Nutzen, wenn Sie den Median der Daten finden. Sie können keinen Mittelwert für findenf( x | μ ) =1π11 + ( x - μ)2,
da es nicht existiert. Weil es keinen Mittelwert hat, hat es auch keine Varianz. Da es keine Varianz gibt, können Sie den quadratischen Verlust nicht minimieren. Folglich würde der quadratische Nutzen, wenn er der wahre Fall wäre, durch irgendeinen Wert in den reellen Zahlen minimiert.
Wenn Sie die entarteten Fälle wie im obigen Fall ignorieren, hat das erwartete Dienstprogramm einen unerwarteten Vorteil gegenüber anderen Methoden. Wenn Sie alle möglichen Entscheidungsregeln und Maßnahmen berücksichtigen, die ergriffen werden könnten, wenn Sie das erwartete Dienstprogramm verwenden, erhalten Sie eine Gesamtbestellung. Sie haben Recht, es könnte Bindungen geben, aber da die Auswirkungen aller Parameter berücksichtigt wurden, wäre es Ihnen gleichgültig, ob Sie eine Auswahl mit gebundenem Dienstprogramm treffen.
Die Alternative, die in der frequentistischen Entscheidungstheorie verwendet wird, besteht darin, die Risikofunktion durch stochastische Dominanz zu ordnen. Eine frequentistische Entscheidung gilt als zulässig, wenn sie nicht stochastisch beherrscht werden kann. Dies erlaubt keine vollständige Bestellung. Trotzdem, wennδ( x ) stochastisch dominiert erste Ordnung δ'( x ), dann ist es auch wahr, dass der erwartete Nutzen der Wahl δ>δ'. Die Alternative bringt Ihnen also das gleiche Ergebnis.
Es gibt einige andere Lösungen, die verwendet werden können, aber sie entsprechen entweder der Maximierung des erwarteten Nutzens oder sie werfen die Frage auf, warum Sie sie in den Fällen verwenden würden, in denen dies nicht der Fall ist. Stellen Sie sich als weiteres statistisches Beispiel vor, Sie lesen eine Forschungsstudie mit einer Stichprobengröße von einer Million Beobachtungen unter Verwendung von Maximum-Likelihood-Methoden oder Bayes'schen Methoden. Sie replizieren die Studie mit einer Stichprobengröße von 100 und schätzen den Mittelwert und die Varianz mithilfe eines unverzerrten Schätzers. Weder Bayes'sche noch Maximum-Likelihood-Schätzer sind im allgemeinen Fall unvoreingenommen.
Sie bestehen darauf, dass Sie Ihre Schätzungen nicht kombinieren, da die andere Schätzung voreingenommen ist, während Ihre unvoreingenommen ist. Bayesianische Methoden bieten eine disziplinierte Methode, um die Stichproben zu einem einzigen Punktschätzer zu kombinieren und so Ihren Nutzen zu maximieren. Sie bestehen darauf, die Informationen in der Stichprobe von einer Million Personen zugunsten der Unparteilichkeit zu verlieren.
Wenn Ihr Dienstprogramm eine sehr starke Tendenz zu unvoreingenommenen Schätzern hätte, würden Sie Ihren Nutzen maximieren, indem Sie den Nutzen Ihres Schätzers nicht maximieren. Wenn dies nicht der Fall ist, ist der voreingenommene Schätzer weitaus genauer als der Ihrer kleinen Stichprobe. Wenn die Genauigkeit Ihren Nutzen maximiert, wählen Sie am Ende einen Schätzer, der den Nutzen maximiert.
Verwechseln Sie die Erwartung des Dienstprogramms nicht mit dem erwarteten Wert der Aktion. Das sind verschiedene Dinge.
Erwägen Sie außerdem, den erwarteten Nutzen im Vergleich zum mittleren Nutzen zu maximieren. Sie nehmen den Nutzen jedes Ergebnisses multipliziert mit seiner Wahrscheinlichkeit und summieren es.E[U(x~)]=∫x~∈χU(x~)Pr(x~)dx~
Lassen Sie uns nun über den Median-Nutzen nachdenken.M[U(x~)]=c
wenn ∫caU(x~)Pr(x~)dx~=∫bcU(x~)Pr(x~)dx~.
Was würde das bedeuten? Sie wären genauso glücklich, wenn Sie links wie rechts von landen würdenc? Warum sollte dich das interessieren?
Wenn Sie eine Aktion ausgewählt haben, die den erwarteten Nutzen maximiert, können Sie keine Aktion ausführen, von der Sie glauben, dass sie Sie glücklicher macht. Der Median-Nutzen erlaubt keine Maximierung, da die Aktion durch die Kraft ausgewählt wird, in der Mitte zu sein. Sie würden immer die Maßnahmen ergreifen, die Ihnen eine 50-prozentige Chance geben, glücklicher als gewöhnlich oder trauriger als gewöhnlich zu sein. Was für eine seltsame Sache!
EDIT
Aus Kolmogorovs Axiomen muss die Summe einer Verteilung gleich eins sein. Stellen Sie sich einen Fall mit zwei Aktionssätzen vor:a und a′, wo a′ ist die Menge der Aktionen, die nicht sind a.
Konzentration auf aNehmen wir an, dass die Utility-Funktion ist −x2. Nehmen wir das anx, wenn die Aktion ist awird aus gezogen f(x)=exp(−x),x>0.
Bemerken, dass ∫∞0exp(−x)dx=1,
wir können leicht bestätigen, dass es sich um eine Wahrscheinlichkeitsdichtefunktion handelt. Das Einbeziehen von Dienstprogrammen führt zu∫∞0x2exp(−x)dx=−2,
was bestätigt, dass es keine Verteilung ist. E(U(a))=−2.
Es wäre zwar möglich, eine Verteilung nach Dienstprogrammen zu erstellen, dies ist jedoch nicht unbedingt eine Funktion, da if g(x)=U(x)Pr(x), dann g−1(x) ist nicht garantiert eine Funktion.