Der statistische Begriff Abweichung wird etwas zu viel herumgeworfen. Meistens geben Programme die Abweichung
wobei Ihre geschätzten Parameter sind. Aus der Modellanpassung und ergibt sich ein potenziell beobachtetes / beobachtbares Auftreten der fraglichen Zufallsgröße.D ( y) = - 2 log{ p ( y| θ^) } ,
θ yθ^y
Die häufigere Abweichung, auf die Sie sich beziehen, würde die obige Abweichung als Funktion von zwei Variablen behandeln, sowohl den Daten als auch den angepassten Parametern:
und wenn Sie also einen Wert, aber zwei konkurrierende, angepasste Parameterwerte hatten, und , dann Sie würden die von Ihnen erwähnte Abweichung von
Sie können über die von Ihnen erwähnte Matlab-Funktion lesen , die hier verlinkt ist . Eine fruchtbarere, wenn auch kürzere Diskussion der Abweichung ist hier verbunden .D ( y, θ^) = - 2 log{ p ( y| θ^) }
yθ 1 θ 2 - 2 ( log { P ( y | θ 1 ) } - log { P ( y | θ 2 ) } ) .θ^1θ^2- 2 ( log{ p ( y| θ^1) } -log{ p ( y| θ^2) } ).
glmfit()
Die Abweichungsstatistik geht implizit von zwei Modellen aus: Das erste ist Ihr angepasstes Modell, das von zurückgegeben wird glmfit()
. Rufen Sie diesen Parameter vector . Das zweite ist das "Vollmodell" (auch "gesättigtes Modell" genannt), bei dem es für jeden Datenpunkt eine freie Variable gibt. Rufen Sie diesen Parametervektor . Es ist natürlich eine dumme Sache, so viele freie Variablen zu haben, aber es erlaubt Ihnen, genau auf diese Daten zu passen.θ^1 θ sθ^s
Die Abweichungsstatistik wird dann als Differenz zwischen der am angepassten Modell berechneten Log-Wahrscheinlichkeit und dem gesättigten Modell berechnet. Sei die Sammlung der N Datenpunkte. Dann:Y.= { y1, y2, ⋯ , yN.}}
D E.V.( θ^1, Y.) = - 2 [ logp ( Y.| θ^1) -logp ( Y.| θ^s) ] .
Die obigen Begriffe werden durch die Unabhängigkeitsannahme zu Summationen über die einzelnen Datenpunkte . Wenn Sie diese Berechnung verwenden möchten, um die Log-Wahrscheinlichkeit des Modells zu berechnen, müssen Sie zuerst die Log-Wahrscheinlichkeit des gesättigten Modells berechnen. Hier ist ein Link , der einige Ideen für die Berechnung erklärt ... aber der Haken ist, dass Sie in jedem Fall eine Funktion aufschreiben müssen, die die Protokollwahrscheinlichkeit für Ihren Datentyp berechnet, und in diesem Fall Es ist wahrscheinlich nur besser, eine eigene Funktion zu erstellen, die die Log-Wahrscheinlichkeit selbst berechnet, als sie aus einer Abweichungsberechnung zurückzuverfolgen.yich
In Kapitel 6 der Bayes'schen Datenanalyse finden Sie eine gute Diskussion der Abweichung.
Was Ihren zweiten Punkt bezüglich der Wahrscheinlichkeitsteststatistik betrifft, so klingt es so, als ob Sie im Grunde das Richtige wissen. In vielen Fällen betrachten Sie die Nullhypothese jedoch als etwas, das Sie durch externes Expertenwissen im Voraus erraten können (z. B. wenn ein Koeffizient gleich Null ist). Es ist nicht unbedingt etwas, das sich aus der Modellanpassung ergibt.