Die lm-Funktion in R kann die geschätzte Kovarianz von Regressionskoeffizienten ausgeben. Was geben uns diese Informationen? Können wir das Modell jetzt besser interpretieren oder Probleme diagnostizieren, die im Modell vorhanden sein könnten?
Die lm-Funktion in R kann die geschätzte Kovarianz von Regressionskoeffizienten ausgeben. Was geben uns diese Informationen? Können wir das Modell jetzt besser interpretieren oder Probleme diagnostizieren, die im Modell vorhanden sein könnten?
Antworten:
Die grundlegendste Verwendung der Kovarianzmatrix besteht darin, die Standardfehler von Regressionsschätzungen zu erhalten. Wenn der Forscher nur an den Standardfehlern der einzelnen Regressionsparameter selbst interessiert ist, kann er einfach die Quadratwurzel der Diagonale ziehen, um die einzelnen Standardfehler zu erhalten.
Es kann jedoch vorkommen, dass Sie an einer linearen Kombination von Regressionsparametern interessiert sind. Wenn Sie beispielsweise eine Indikatorvariable für eine bestimmte Gruppe haben, ist möglicherweise der Gruppenmittelwert für Sie von Interesse
.
Dann müssten Sie den Standardfehler für den geschätzten Mittelwert dieser Gruppe ermitteln
,
Dabei ist ein Vektor Ihrer Kontraste und die Kovarianzmatrix. Wenn wir in unserem Fall nur die Additionskovariate "grp" haben, dann ist ( für den Achsenabschnitt , für die Zugehörigkeit zur Gruppe).S X = ( 1 , 1 ) 1 1
Darüber hinaus kann die Kovarianzmatrix (oder darüber hinaus die Korrelationsmatrix, die eindeutig aus der Kovarianzmatrix identifiziert wird, aber nicht umgekehrt) für bestimmte Modelldiagnosen sehr nützlich sein. Wenn zwei Variablen stark korrelieren, kann man sich vorstellen, dass das Modell Probleme hat, herauszufinden, welche Variable für einen Effekt verantwortlich ist (weil sie so eng miteinander verbunden sind). Dies kann in einer Vielzahl von Fällen hilfreich sein, z. B. bei der Auswahl von Teilmengen von Kovariaten, die in einem Vorhersagemodell verwendet werden sollen. Wenn zwei Variablen stark korreliert sind, möchten Sie möglicherweise nur eine der beiden in Ihrem Vorhersagemodell verwenden.
Es gibt zwei Arten von Regressionskoeffizienten:
Die Antwort von Cliff AB ist eine gute Zusammenfassung dessen, wofür dies tatsächlich verwendet wird.