Die Quadratsummen bei der linearen Regression sind Sonderfälle der allgemeineren Abweichungswerte im verallgemeinerten linearen Modell. Im allgemeineren Modell gibt es eine Antwortverteilung mit einem Mittelwert, der mit einer linearen Funktion der erklärenden Variablen (mit einem Intercept-Term) verknüpft ist. Die drei Abweichungsstatistiken in einem GLM sind wie folgt definiert:
Null Deviance Explained DevianceResidual Deviance† DTOT=2(ℓ^S−ℓ^0),DREG=2(ℓ^p−ℓ^0), DRES=2(ℓ^S−ℓ^p).
In diesen Ausdrücken der Wert ℓ^S ist die maximierte Log-Wahrscheinlichkeit unter einem gesättigten Modell (ein Parameter pro Datenpunkt), ℓ^0 ist die maximierte Log-Wahrscheinlichkeit unter einem Nullmodell (nur Intercept) und ℓ^p ist die maximierte Log-Wahrscheinlichkeit unter dem Modell (Intercept Term und p Koeffizienten).
Diese Abweichungsstatistiken spielen eine Rolle analog zu skalierten Versionen der Quadratsummen bei der linearen Regression. Es ist leicht zu erkennen, dass sie die Zersetzung befriedigenDTOT=DREG+DRESDies ist analog zur Zerlegung der Quadratsummen in der linearen Regression. In der Tat erhalten Sie in dem Fall, in dem Sie eine normale Antwortverteilung mit einer linearen Verknüpfungsfunktion haben, ein lineares Regressionsmodell, und die Abweichungsstatistik reduziert sich auf Folgendes:
DTOT=1σ2∑i=1n(yi−y¯)2=1σ2⋅SSTOT,DREG=1σ2∑i=1n(y^i−y¯)2=1σ2⋅SSREG,DRES=1σ2∑i=1n(yi−y^i)2=1σ2⋅SSRES.
Der Variationskoeffizient in einem linearen Regressionsmodell ist nun eine Anpassungsgütestatistik, die den Anteil der Gesamtvariation in der Antwort misst, der auf die erklärenden Variablen zurückzuführen ist. Eine natürliche Erweiterung im Fall eines GLM besteht darin, die Statistik zu bilden:
R2GLM=1−DRESDTOT=DREGDTOT.
Es ist leicht zu erkennen, dass sich diese Statistik im Spezialfall der linearen Regression auf den Variationskoeffizienten reduziert, da sich die Skalierungswerte aufheben. Im breiteren Kontext eines GLM hat die Statistik eine natürliche Interpretation, die ihrer Interpretation in der linearen Regression entspricht: Sie gibt den Anteil der Nullabweichung an, der durch die erklärenden Variablen im Modell erklärt wird.
Nachdem wir nun gesehen haben, wie sich die Quadratsummen in der linearen Regression auf die Abweichungen in einem GLM erstrecken, können wir sehen, dass der reguläre Variationskoeffizient im nichtlinearen Modell ungeeignet ist, da er spezifisch für den Fall von a ist lineares Modell mit einem normalverteilten Fehlerterm. Wir können jedoch sehen, dass der Standardvariationskoeffizient zwar unangemessen ist, es jedoch möglich ist, unter Verwendung der Abweichungswerte mit einer analogen Interpretation eine geeignete Analogie zu bilden.
† Die verbleibende Abweichung wird manchmal nur als Abweichung bezeichnet.