Nein, studentisierte Residuen und standardisierte Residuen sind unterschiedliche (aber verwandte) Konzepte.
R bietet in der Tat eingebaute Funktionen rstandard()
und rstudent()
als Teil von Einflussmaßnahmen . Das gleiche integrierte Paket bietet viele ähnliche Funktionen für Hebelwirkung, Cooks Abstand usw., die rstudent()
im Wesentlichen MASS::studres()
mit denen übereinstimmen, die Sie wie folgt selbst überprüfen können:
> all.equal(MASS::studres(model), rstudent(model))
[1] TRUE
Standardisierte Residuen sind eine Möglichkeit, den Fehler für einen bestimmten Datenpunkt zu schätzen, wobei die Hebelwirkung / der Einfluss des Punkts berücksichtigt wird. Diese werden manchmal als "intern studentisierte Residuen" bezeichnet.
ri=eis(ei)=eiMSE(1−hii)−−−−−−−−−−−√
Die Motivation hinter standardisierten Residuen ist, dass, obwohl unser Modell Homoskedastizität mit einem iid-Fehlerterm mit fester Varianz , die Verteilung, die Residuen nicht iid sein können, weil die Die Summe der Residuen ist immer genau Null.ϵi∼N(0,σ2)ei
Studentisierte Residuen für einen bestimmten Datenpunkt werden aus einem Modell berechnet, das an jeden anderen Datenpunkt mit Ausnahme des betreffenden Datenpunkts angepasst ist. Diese werden verschiedentlich als "extern studentisierte Residuen", "gelöschte Residuen" oder "Jackknifed-Residuen" bezeichnet.
Dies klingt rechenintensiv (es klingt so, als müssten wir für jeden Punkt ein neues Modell anpassen), aber tatsächlich gibt es eine Möglichkeit, es nur aus dem Originalmodell zu berechnen, ohne es neu anzupassen. Wenn das standardisierte Residuum , ist das studentisierte Residuum :riti
ti=ri(n−k−2n−k−1−r2i)1/2,
Die Motivation für studentisierte Residuen liegt in ihrer Verwendung bei Ausreißertests. Wenn wir vermuten, dass ein Punkt ein Ausreißer ist, wurde er per Definition nicht aus dem angenommenen Modell generiert. Daher wäre es ein Fehler - ein Verstoß gegen Annahmen -, diesen Ausreißer in die Anpassung des Modells einzubeziehen. Studentisierte Residuen werden häufig bei der praktischen Erkennung von Ausreißern verwendet.
Studentisierte Residuen haben auch die wünschenswerte Eigenschaft, dass für jeden Datenpunkt die Verteilung des Residuums die t-Verteilung des Schülers ist, vorausgesetzt, die Normalitätsannahmen des ursprünglichen Regressionsmodells wurden erfüllt. (Standardisierte Residuen haben keine so schöne Verteilung.)
Um Bedenken auszuräumen, dass die R-Bibliothek möglicherweise einer anderen als der oben genannten Nomenklatur folgt, heißt es in der R-Dokumentation ausdrücklich, dass sie "standardisiert" und "studentisiert" in genau demselben oben beschriebenen Sinne verwenden.
Funktioniert rstandard
und rstudent
gibt die standardisierten bzw. studentisierten Residuen an. (Diese normalisieren die Residuen erneut, um eine Einheitsvarianz zu erhalten, wobei ein Gesamt- bzw. ein Auslassmaß der Fehlervarianz verwendet wird.)
R
Terminologie das Gegenteil von Montgomery, Peck und Vining (ein beliebtes Regressionslehrbuch, das es seit 35 Jahren gibt). Seien Sie also vorsichtig und lesen Sie dieR
Dokumentation und gegebenenfalls den Quellcode, anstatt sich auf die Bedeutung der Terminologie zu verlassen.