Wie ist die Beziehung zwischen Schätzer und Schätzung?
Wie ist die Beziehung zwischen Schätzer und Schätzung?
Antworten:
EL Lehmann beantwortet diese Frage in seiner klassischen Theorie der Punktschätzung auf den Seiten 1-2.
Es wird nun postuliert, dass die Beobachtungen die Werte sind, die von Zufallsvariablen übernommen werden, von denen angenommen wird, dass sie einer gemeinsamen Wahrscheinlichkeitsverteilung folgen , die zu einer bekannten Klasse gehört ...
... spezialisieren wir uns nun auf die Punktschätzung ... nehmen wir an, dass eine reelle Funktion ist, die [für die festgelegte Klasse von Verteilungen] definiert ist, und dass wir den Wert von [für welche Verteilung auch immer] wissen möchten Wirkung, ]. Leider ist und damit unbekannt. Die Daten können jedoch verwendet werden, um eine Schätzung von , einem Wert, von dem man hofft, dass er nahe an .g θ θ g ( θ ) g ( θ ) g ( θ )
In Worten: Ein Schätzer ist eine bestimmte mathematische Prozedur, die eine Zahl (die Schätzung ) für jeden möglichen Datensatz liefert, den ein bestimmtes Problem erzeugen könnte. Diese Zahl soll eine bestimmte numerische Eigenschaft ( ) des Datenerzeugungsprozesses darstellen; wir könnten dies den "Schätzer" nennen.
Der Schätzer selbst ist keine Zufallsvariable, sondern nur eine mathematische Funktion. Die Schätzung basiert jedoch auf Daten, die selbst als Zufallsvariablen modelliert werden. Dies macht die Schätzung (von der angenommen wird, dass sie von den Daten abhängt) zu einer Zufallsvariablen, und eine bestimmte Schätzung für einen bestimmten Datensatz wird zu einer Realisierung dieser Zufallsvariablen.
In einer (herkömmlichen) gewöhnlichen Formel der kleinsten Quadrate bestehen die Daten aus geordneten Paaren . Das x i wurde vom Experimentator bestimmt (es kann sich beispielsweise um Mengen eines verabreichten Arzneimittels handeln). Eswird angenommen, dassjedes y i (z. B. eine Antwort auf das Medikament) aus einer Wahrscheinlichkeitsverteilung stammt, die normal ist, aber einen unbekannten Mittelwert μ i und einegemeinsameVarianz σ 2 aufweist . Weiterhin wird angenommen, dass die Mittelwerte über eine Formel μ i = β 0 mit x i in Beziehung stehen . Diese drei Parameter - σ , β 0 und β 1 - bestimmen die zugrunde liegende Verteilung von y i für einen beliebigen Wert von x i . Mankann sichdaherjedeEigenschaft dieser Verteilung als Funktion von ( σ , β 0 , β 1 ) vorstellen . Beispiele für solche Eigenschaften sind der Achsenabschnitt β 0 , die Steigung β 1 , der Wert von cos ( σ + βoder sogar der Mittelwert bei dem Wertx=2, der (gemäß dieser Formulierung)β0+2β1 sein muss.
In diesem OLS Zusammenhang ist ein nicht-Beispiel eines Schätzers wäre ein Verfahren zu sein , bei dem Wert der zu erraten , , wenn x gleich 2 gesetzt wurden Dies ist nicht ein Schätzer , da dieser Wert von y ist zufällig (in einer Weise vollständig getrennt von die Zufälligkeit der Daten): Es ist keine (definitiv numerische) Eigenschaft der Verteilung, obwohl es mit dieser Verteilung zusammenhängt. (Wie wir jedoch gerade gesehen haben, kann die Erwartung von y für x = 2 , gleich β 0 + 2 β 1 , geschätzt werden.)
In Lehmanns Formulierung kann fast jede Formel ein Schätzer für fast jede Eigenschaft sein. Es gibt keine inhärente mathematische Verbindung zwischen einem Schätzer und einem Schätzer. Wir können jedoch im Voraus einschätzen, wie wahrscheinlich es ist, dass ein Schätzer der zu schätzenden Menge angemessen nahe kommt. Möglichkeiten dazu und wie man sie ausnutzt, sind Gegenstand der Schätzungstheorie.
Kurz gesagt: Ein Schätzer ist eine Funktion und ein Schätzer ist ein Wert, der eine beobachtete Stichprobe zusammenfasst.
Ein Schätzer ist eine Funktion, die der Parameterschätzung eine Zufallsstichprobe zuordnet:
Es kann hilfreich sein, die Antwort von whuber im Kontext eines linearen Regressionsmodells zu veranschaulichen. Angenommen, Sie haben einige bivariate Daten und verwenden gewöhnliche kleinste Quadrate, um das folgende Modell zu erstellen:
Y = 6X + 1
Zu diesem Zeitpunkt können Sie jeden Wert von X nehmen, in das Modell einfügen und das Ergebnis Y vorhersagen. In diesem Sinne können Sie sich die einzelnen Komponenten der generischen Form des Modells ( mX + B ) als Schätzer vorstellen . Die Beispieldaten (die Sie vermutlich in das generische Modell eingefügt haben, um die spezifischen Werte für m und B oben zu berechnen ) lieferten eine Grundlage, auf der Sie Schätzungen für m bzw. B erstellen konnten.
In Übereinstimmung mit den @ whuber-Punkten in unserem Thread unten werden im Kontext der linearen Regression alle Werte von Y , für die Sie eine bestimmte Menge von Schätzern generiert haben, als vorhergesagte Werte angesehen.
(einige Male bearbeitet, um die folgenden Kommentare wiederzugeben)
Angenommen, Sie haben einige Daten erhalten und eine beobachtete Variable namens Theta. Jetzt können Ihre Daten aus einer Datenverteilung stammen. Für diese Verteilung gibt es einen entsprechenden Wert von Theta, auf den Sie schließen, der eine Zufallsvariable ist. Sie können den MAP oder Mittelwert verwenden, um die Schätzung dieser Zufallsvariablen zu berechnen, wenn sich die Verteilung Ihrer Daten ändert. Die Zufallsvariable Theta ist also eine Schätzung , ein einzelner Wert der nicht beobachteten Variablen für einen bestimmten Datentyp.
Während Estimator ist Ihre Daten, die auch eine Zufallsvariable ist. Für verschiedene Arten von Verteilungen haben Sie unterschiedliche Arten von Daten und somit eine unterschiedliche Schätzung, weshalb diese entsprechende Zufallsvariable Schätzer genannt wird .