Zusätzlich zur Antwort von @ DavidSmith folgt eine formellere Terminologie:
Verallgemeinerte lineare Modelle rufen als Folge der Verknüpfungsfunktion eine Mittelwert-Varianz-Beziehung auf . In einem GLM gibt es keine Residuen, da die Varianz nur eine Funktion des Mittelwerts ist. Wenn wir also ein GLM schreiben, hat es die Form:
g(E[Y|X])=βX
Wenn eine Verknüpfungsfunktion ist, sind die Terme die linearen Prädiktoren und die transformierten Werte sind die angepassten Werte. Im Allgemeinen ist der Fall, dass impliziert . Zum Beispiel, mit logistischer Regression, die inverse logit Link hat wobei der zweite Ausdruck leicht als Binomialvarianz erkannt wird.gβXνg−1(βX)E[Y]=g−1(βX)var(Y)=∂∂βg−1(βX)g−1(x)=log(X1−X)g′−1(X)=log(11−X)=g−1(X)(1−g−1(X))
Wenn Sie die Schätzgleichungen für gängige Wahrscheinlichkeitsmodelle wie Binomial, Poisson oder Exponential schreiben, stellen Sie tatsächlich fest, dass die Informationen (oder Varianz) vom Mittelwert und nichts anderem abhängen. Diese Ein-Parameter-Modelle verwenden, wie der Name schon sagt, nur einen Parameter (wie eine logarithmische Quote oder eine logarithmische relative Rate), um das erwartete Ergebnis mit einer linearen Kombination von Prädiktoren und einer entsprechenden Verknüpfungsfunktion in Beziehung zu setzen. Die Einflussfunktion (Gradient oder Ableitung) der Verknüpfung bezieht den Mittelwert auf die Varianz.
Gaußsche Wahrscheinlichkeitsmodelle unterscheiden sich von binomialen (logistischen) Modellen darin, dass es sich um 2- Parameter-Modelle handelt, die einen Dispersionsterm (Sigma oder die Restvarianz) enthalten. Ein Gaußsches Modell unterscheidet sich auch von anderen 2-Parameter-Modellen (wie negatives Binomial oder Gamma), da Sie die Restvarianz als separaten Term in ein Modell schreiben können.
Grundsätzlich sind die gewöhnlichen kleinsten Quadrate mit normalem, unabhängigem Fehler der einzige Fall, von dem ich weiß, wo wir tatsächlich schreiben können: sinnvoll.y=βX+ϵ
Die größere Frage, wie Sie erwartete Ergebnisse mit beobachteten Ergebnissen in Beziehung setzen, ist kompliziert. In einem normalen Modell ist dies ein einfacher Unterschied zwischen erwartet und beobachtet, um einen Rest zu erhalten. In GLMs ist die Varianz heteroskedastisch, da sich der Mittelwert als Funktion von ändert. Sie können also jedes Residuum standardisieren, indem Sie es durch den erwarteten Standardfehler dividieren, um Pearson-Residuen zu erhalten.X