In GLM ist die Vorhersage eine nichtlineare Funktion des Produkts der Kovariaten mit dem geschätzten Koeffizientenvektor :
Endliche Stichprobenverteilung von ist im Allgemeinen unbekannt, aber solange eine maximale Wahrscheinlichkeitsschätzung ist , hat es eine asymptotische Normalverteilung , wobei ist die hessische Matrix der Wahrscheinlichkeitsfunktion in ihrem Maximum. Die p-Werte vonfXβ^
y^=f(Xβ^)
β^β^ N(β,−H−1)Hβdie als Ergebnis einer Regression gezeigt werden, basieren fast immer auf dieser Asymptotik. Wenn Sie jedoch der Meinung sind, dass Ihre Stichprobe für Asymptotika zu klein ist, verwenden Sie die numerische Verteilung (z. B. Bootstrapping).
Wenn Sie die asymptotische Normalverteilung von (und damit ) verwenden, ist die Verteilung von aufgrund von nichtlinearem immer noch nicht normal . Sie können es ignorieren - erhalten Sie normale Konfidenzgrenzen für und fügen Sie sie in , wobei Sie Grenzen für als .β^Xβ^y^f(zlower,zupper)Xβfy(ylower,yupper)=(f(zlower),f(zupper))
Eine andere Strategie ( Delta-Methode genannt ) besteht darin, eine Taylor-Erweiterung von um - sie wird in linear sein . Daher können Sie die Verteilung von als
fXβ^β^f(Xβ^)
f(Xβ^)∼N(f(Xβ),−(f′(Xβ))2XH−1XT)
Dann würde das asymptotische 95% -Konfidenzintervall für so aussehenf(Xβ)
f(Xβ^)±1.96(f′(Xβ^))2XH(β^)−1XT−−−−−−−−−−−−−−−−−−√
Jetzt müssen Sie nur noch Ausdruck für hessische Matrizen für bestimmte Modelle finden, wie z. B. die logistische Regression in dieser Frage . Und diese Frage bietet einen praktischen Vergleich von Bootstrap, transformierten Normalgrenzen und Delta-Methode für die logistische Regression.