Ich habe möglicherweise widersprüchliche Definitionen für die Kreuzvalidierungsstatistik (CV) und die generalisierte Kreuzvalidierungsstatistik (GCV) gefunden, die mit einem linearen Modell (mit einem normalen homoskedastischen Fehlervektor ).& egr;
Einerseits definieren Golub, Heath & Wahba die GCV-Schätzung als (S. 216).
der durch gegebene Minimierer von wobei A \ left (\ lambda \ right) = X \ left (X ^ TX + n \ lambda I \ right) ^ {- 1} X ^ TA(λ)=X(XTX+nλI)-1XT
Auf der anderen Seite definiert Efron dasselbe Konzept wie (S. 24), schreibt jedoch die Einführung dieses Konzepts Craven & Wahba zu, dessen Definition (S. 377) im Wesentlichen identisch ist wie die oben erwähnte Definition von Golub, Heath & Wahba.
Bedeutet dies, dass 0 V \ left (\ lambda \ right) minimiert ?
In ähnlicher Weise definieren Golub, Heath & Wahba die CV-Schätzung von (S. 217) als Minimierer von
Dabei ist die Schätzung
von mit dem ten Datenpunkt weggelassen.
Die Autoren führen die Einführung der CV-Schätzung (auch PRESS-Schätzung genannt) auf Allen zurück ("Allen's PRESS", ebenda). In Allens Aufsatz wird die PRESS-Schätzung jedoch als n P \ left (0 \ ) definiert (S. 126). rechts) (in Efrons Artikel wird es als (S. 24)).
Bedeutet dies wiederum, dass 0 P \ left (\ lambda \ right) minimiert ?
Allen, David M. Die Beziehung zwischen Variablenauswahl und Datendokumentation und eine Methode zur Vorhersage. Technometrics. 16, No. 1 (Februar 1974), S. 125-127
Craven, Peter und Wahba, Grace. Glätten von verrauschten Daten mit Spline-Funktionen. Numerische Mathematik 31 (1979), S. 377-403
Efron, Bradley. Wie voreingenommen ist die scheinbare Fehlerrate einer logistischen Regression? Technischer Bericht Nr. 232. Institut für Statistik, Stanford University (April 1985)
Golub, Gene H., Heath und Grace Wahba. Verallgemeinerte Kreuzvalidierung als Methode zur Auswahl eines guten Firstparameters. Technometrics. 21, No. 2 (Mai 1979), S. 215-223