Wie kjetil b halvorsen ausführte, ist es auf seine Weise ein Wunder, dass die lineare Regression eine analytische Lösung zulässt. Und das nur aufgrund der Linearität des Problems (in Bezug auf die Parameter). In OLS haben Sie
was die Bedingungen erster Ordnung hat
- 2 ∑ i ( y i - x ' i β ) x i = 0
Für ein Problem mit p
∑i(yi−x′iβ)2→minβ,
−2∑i(yi−x′iβ)xi=0
pVariablen (einschließlich Konstante, falls erforderlich - es gibt auch eine gewisse Regression durch die Ursprungsprobleme), dies ist ein System mit
Gleichungen und
p Unbekannten. Am wichtigsten ist, dass es sich um ein lineares System handelt, sodass Sie eine Lösung unter Verwendung der Standardtheorie
und -praxis der
linearen Algebra finden können . Dieses System hat eine Lösung mit der Wahrscheinlichkeit 1, es sei denn, Sie haben perfekt kollineare Variablen.
pp
Mit der logistischen Regression ist es nicht mehr so einfach. Schreiben Sie die log-Likelihood-Funktion auf,
und wenn wir die Ableitung nehmen, um die MLE zu finden, erhalten wir
∂ l
l(y;x,β)=∑iyilnpi+(1−yi)ln(1−pi),pi=(1+exp(−θi))−1,θi=x′iβ,
Die Parameter
βgeben dies auf sehr nichtlineare Weise ein: Für jedes
igibt es eine nichtlineare Funktion, und sie werden addiert. Es gibt keine analytische Lösung (außer wahrscheinlich in einer trivialen Situation mit zwei Beobachtungen, oder so ähnlich), und Sie müssen verwenden
nichtlineare Optimierungsverfahrendie Schätzungen finden
ß .
∂l∂β′=∑idpidθ(yipi−1−yi1−pi)xi=∑i[yi−11+exp(x′iβ)]xi
βiβ^
Ein etwas tieferer Blick auf das Problem (unter Verwendung der zweiten Ableitung) zeigt, dass es sich um ein konvexes Optimierungsproblem handelt, bei dem ein Maximum einer konkaven Funktion (eine verherrlichte multivariate Parabel) gefunden wird. Es gibt also eine von beiden, und jeder sinnvolle Algorithmus sollte dies eher finden schnell, oder die Dinge sprengen ins Unendliche. Letzteres tut zufällig logistische Regression , wenn für einige cProb[Yi=1|x′iβ>c]=1cSie haben also eine perfekte Vorhersage. Dies ist ein ziemlich unangenehmes Artefakt: Sie würden denken, wenn Sie eine perfekte Vorhersage haben, funktioniert das Modell perfekt, aber seltsamerweise ist es umgekehrt.