Mir ist klar und an mehreren Stellen gut erklärt, welche Informationen die Werte auf der Diagonale der Hutmatrix für die lineare Regression liefern.
Die Hutmatrix eines logistischen Regressionsmodells ist mir weniger klar. Ist es identisch mit den Informationen, die Sie durch lineare Regression aus der Hutmatrix erhalten? Dies ist die Definition der Hutmatrix, die ich zu einem anderen Thema des Lebenslaufs gefunden habe (Quelle 1):
mit X ist der Vektor der Prädiktorvariablen und V eine Diagonalmatrix mit .
Stimmt es mit anderen Worten auch, dass der bestimmte Wert der Hutmatrix einer Beobachtung nur die Position der Kovariaten im Kovariatenraum darstellt und nichts mit dem Ergebniswert dieser Beobachtung zu tun hat?
Dies steht im Buch "Kategoriale Datenanalyse" von Agresti:
Je größer die Hebelwirkung einer Beobachtung ist, desto größer ist ihr potenzieller Einfluss auf die Passform. Wie bei der normalen Regression fallen die Hebel zwischen 0 und 1 und addieren sich zur Anzahl der Modellparameter. Im Gegensatz zur normalen Regression hängen die Hutwerte sowohl von der Anpassung als auch von der Modellmatrix ab, und Punkte mit extremen Prädiktorwerten müssen keinen hohen Hebel aufweisen.
Ausgehend von dieser Definition können wir sie also nicht so verwenden, wie wir sie in der normalen linearen Regression verwenden.
Quelle 1: Wie berechnet man die Hutmatrix für die logistische Regression in R?