- Was ist die Orakeleigenschaft eines Schätzers?
- Für welche Modellierungsziele ist die Orakeleigenschaft relevant (prädiktiv, erklärend, ...)?
Sowohl theoretisch rigorose als auch (besonders) intuitive Erklärungen sind willkommen.
Sowohl theoretisch rigorose als auch (besonders) intuitive Erklärungen sind willkommen.
Antworten:
Ein Orakel kennt die Wahrheit: Es kennt die wahre Untergruppe und ist bereit, darauf zu reagieren. Die Orakeleigenschaft ist, dass die asymptotische Verteilung des Schätzers dieselbe ist wie die asymptotische Verteilung des MLE auf nur der wahren Unterstützung. Das heißt, der Schätzer passt sich an, die wahre Unterstützung zu kennen, ohne einen Preis zu zahlen (im Sinne der asymptotischen Verteilung).
Durch die asymptotischen Optimalitätseigenschaften des MLE, die zum Beispiel in Keeners theoretischer Statistik in Satz 9.14 diskutiert wurden, wissen wir unter einigen technischen Bedingungen, die gelten, wenn zum Beispiel der Fehler Gaußsch ist, dass wobei wir annehmen, dass der wahre Koeffizient ist auf der wahren Unterstützung . Beachten Sie, dass die Varianz der asymptotischen Verteilung umgekehrt zur Fisher-Information ist und zeigt, dass asymptotisch effizient ist. Da der MLE, der die wahre Unterstützung kennt, dies erreicht, ist dies auch als Teil der Orakeleigenschaft erforderlich.
Wir zahlen jedoch einen hohen nichtasymptotischen Preis: siehe zum Beispiel
Hannes Leeb, Benedikt M. Pötscher, Spärliche Schätzer und das Orakelgut oder die Rückkehr von Hodges 'Schätzer, Journal of Econometrics, Band 142, Ausgabe 1, 2008, Seiten 201-211,
was zeigt, dass das Risiko eines "Orakelschätzers" (im Sinne von Fan und Li, 2001) ein Supremum hat, das gegen unendlich geht.
Die Definition der Oracle-Eigenschaft hängt stark vom Kontext ab. Die sehr kurze aber präzise Antwort in linearer Regression (präzise hochdimensionale) lautet:
Ein Orakelschätzer muss bei der Parameterschätzung und Variablenauswahl konsistent sein.
Beachten Sie, dass ein Schätzer, der bei der Variablenauswahl konsistent ist, bei der Parameterschätzung nicht unbedingt konsistent ist. Weitere mathematische Definitionen finden Sie im adaptiven Lasso- Artikel oder auf diesen Folien .