Für welches Problem oder Spiel sind Varianz und Standardabweichung optimale Lösungen?


9

Für eine bestimmte Zufallsvariable (oder eine Population oder einen stochastischen Prozess) ist die mathematische Erwartung die Antwort auf eine Frage. Welche Punktprognose minimiert den erwarteten quadratischen Verlust? . Es ist auch die optimale Lösung für ein Spiel. Erraten Sie die nächste Realisierung einer Zufallsvariablen (oder eines neuen Draws aus einer Population), und ich werde Sie mit dem quadratischen Abstand zwischen dem Wert und Ihrer Vermutung bestrafen, wenn Sie eine lineare Disutilität haben der Bestrafung. Der Median ist die Antwort auf eine entsprechende Frage unter absolutem Verlust und der Modus ist die Antwort unter "Alles oder Nichts" -Verlust.

Fragen: Beantworten Varianz und Standardabweichung ähnliche Fragen? Was sind Sie?

Die Motivation für diese Frage ergibt sich aus der Vermittlung grundlegender Maßnahmen der zentralen Tendenz und Verbreitung. Während die Maßnahmen der zentralen Tendenz durch die oben genannten entscheidungstheoretischen Probleme motiviert werden können, frage ich mich, wie man die Maßnahmen der Verbreitung motivieren kann.


1
Sehr interessante Frage. Mein anfänglicher Ansatz wäre, dass das "Spiel" qualitativ das gleiche ist wie das, was Sie bereits beschrieben haben, außer dass die Frage erwartet (kein Wortspiel beabsichtigt), dass die Antwort sich auf einen Wertebereich anstatt auf einen Punkt bezieht, da sie ohne einen Punkt von verbreitet wird Referenz ist eher unvollständige (wenn nicht bedeutungslose) Information.
Emil

Beachten Sie, dass die Varianz selbst eine Erwartung ist - wenn dann ist Var ( X ) = E ( Y ) . Y.=(X.- -μ)2Var(X.)=E.(Y.)
Glen_b -Reinstate Monica

@Glen_b, du hast recht, und das habe ich (ich hätte das in den Fragentext aufnehmen sollen). "Errate den Unterschied zwischen dem nächsten Wert und der Erwartung und ich werde dich quadratisch bestrafen" wäre das Spiel. Ist das das Beste, was es gibt? Klingt nicht sehr praktisch oder macht ein Spiel sehr viel Spaß, IMHO.
Richard Hardy

Antworten:


2

Wenn ich die Frage als beabsichtigt verstanden habe, denken Sie an eine Einstellung, in der Sie unabhängige Realisierungen jeder Zufallsvariablen X. mit jeder Verteilung F (mit endlicher Varianz σ2(F) ) erhalten können. Das "Spiel" wird durch die zu beschreibenden Funktionen h und L . Es besteht aus folgenden Schritten und Regeln:

  1. Dein Gegner ( "Nature") zeigt , F.

  2. Als Antwort erzeugen Sie eine Zahl t(F.), Ihre "Vorhersage".

Um das Ergebnis des Spiels zu bewerten, werden die folgenden Berechnungen durchgeführt:

  • Eine Stichprobe von n iid Beobachtungen X.=X.1,X.2,,X.n wird aus F..

  • Eine vorbestimmte Funktion h wird auf die Probe angewendet, wodurch eine Zahl h(X.), die "Statistik", erzeugt wird.

  • Die "Verlustfunktion" L. vergleicht Ihre "Vorhersage" t(F) mit der Statistik h(X), erzeugt eine nicht negative Zahl L(t(F),h(X)).

  • Das Ergebnis des Spiels ist der erwartete Verlust (oder "Risiko")

    R.(L.,h)(t,F.)=E.(L.(t(F.),h(X.))).

Ihr Ziel ist es, auf die Bewegung der Natur zu reagieren, indem Sie ein t angeben, das das Risiko minimiert.

Zum Beispiel in dem Spiel mit der Funktion h(X.1)=X.1 und jeder Verlust von Form L.(t,h)=λ(t- -h)2 für einige positive Zahl λ, Ihr optimalen bewegen holen t(F.) die Erwartung von F..

Die Frage vor uns ist:

Gibt es L. und h für die die optimale Bewegung darin besteht, t(F.) als Varianz σ2(F.) zu wählen ?

Dies lässt sich leicht beantworten, indem die Varianz als Erwartung dargestellt wird. Eine Möglichkeit besteht darin, festzulegen, dass

h(X.1,X.2)=12(X.1- -X.2)2
und weiterhin quadratischen Verlust
L.(t,h)=(t- -h)2.
Nachdem ich das beobachtet habe

E.(h(X.))=σ2(F.),

Das Beispiel lässt den Schluss zu, dass dieses h und dieses L. die Frage nach der Varianz beantworten.


Was ist mit der Standardabweichung σ(F.) ? Auch hier müssen wir dies nur als Erwartung einer Stichprobenstatistik ausstellen. Dies ist jedoch nicht möglich, da selbst wenn wir F. auf die Familie der Bernoulli (p) -Verteilungen beschränken, wir nur unverzerrte Schätzer der Polynomfunktionen von p, aber σ(F.)=p(1- -p) ist keine Polynomfunktion in der Domänep(0,1). (SieheFür die Binomialverteilung, warum gibt es fürkeinen unverzerrten Schätzer?1/pFür das allgemeine Argument über Binomialverteilungen, auf das diese Frage reduziert werden kann, nachdemhüber alle Permutationen desXi.gemittelt wurde.)


Vielen Dank für eine klare Formulierung meiner Frage und eine ebenso klare Antwort. Hätten Sie auch ein Beispiel für , das von allen n Stichprobenpunkten abhängt , nicht nur von zwei? hn
Richard Hardy

2
Es gibt einen Standardweg von nach n : Berechnen Sie die Statistik für alle Paare und den Durchschnitt. Dies führt in der Tat zu meiner Charakterisierung der Kovarianz unter stats.stackexchange.com/a/18200/919 . Lesen Sie für die formale Theorie dazu die U-Statistik . 2n
whuber

1
Vielen Dank!
Richard Hardy
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.