Die logistische Regression kann als lineare Kombination beschrieben werden
η=β0+β1X1+...+βkXk
das wird durch die Verknüpfungsfunktion :g
g(E(Y))=η
Dabei ist die Link-Funktion eine Logit- Funktion
E(Y|X,β)=p=logit−1(η)
Dabei nimmt nur Werte in und inverse Logit-Funktionen transformieren die Linearkombination in diesen Bereich. Hier endet die klassische logistische Regression.{ 0 , 1 } ηY{0,1}η
Wenn Sie sich jedoch daran erinnern, dass für Variablen ist, die nur Werte in annehmen , kann als . In diesem Fall könnte die Ausgabe der Logit-Funktion als bedingte Wahrscheinlichkeit des "Erfolgs" angesehen werden, dh . Die Bernoulli-Verteilung ist eine Verteilung, die die Wahrscheinlichkeit der Beobachtung eines binären Ergebnisses mit einem Parameter beschreibt, sodass wir als beschreiben können{ 0 , 1 } E ( Y | X , β ) P ( Y = 1 | X , β ) P ( Y = 1 | X , β ) p Y.E(Y)=P(Y=1){0,1}E(Y|X,β)P(Y=1|X,β)P(Y=1|X,β)pY
yi∼Bernoulli(p)
Bei der logistischen Regression suchen wir nach einigen Parametern , die zusammen mit unabhängigen Variablen eine lineare Kombination . In der klassischen Regression ist (wir nehmen an, dass die Verknüpfungsfunktion eine Identitätsfunktion ist). Um jedoch zu modellieren , das Werte in annimmt, müssen wir so transformieren, dass es passt im Bereich .X η E ( Y | X , β ) = η Y { 0 , 1 } η [ 0 , 1 ]βXηE(Y|X,β)=ηY{0,1}η[0,1]
Um die logistische Regression auf Bayes'sche Weise abzuschätzen, nehmen Sie einige Prioritäten für Parameter wie bei der linearen Regression (siehe Kruschke et al., 2012 ) und transformieren die lineare Kombination mit der logit-Funktion , um ihre Ausgabe als zu verwenden Parameter der Bernoulli-Verteilung, der Ihre Variable beschreibt. Also, ja, Sie verwenden die Gleichung und die Logit-Link-Funktion tatsächlich auf die gleiche Weise wie im frequenzistischen Fall, und der Rest funktioniert (z. B. Auswahl von Prioritäten) wie bei der Schätzung der linearen Regression auf Bayes'sche Weise. η p Y.βiηpY
Der einfache Ansatz für die Auswahl von Prioritäten besteht darin, Normalverteilungen (Sie können aber auch andere Verteilungen verwenden, z. B. oder Laplace-Verteilung für ein robusteres Modell) für mit den Parametern und , die voreingestellt oder verwendet werden von hierarchischen Prioritäten . Mit der Modelldefinition können Sie jetzt Software wie JAGS verwenden , um eine Markov-Ketten-Monte-Carlo- Simulation durchzuführen und das Modell zu schätzen. Im Folgenden wird ich JAGS Code für einfaches logistisches Modell Post (Check hier für weitere Beispiele).β i μ i σ 2 itβiμiσ2i
model {
# setting up priors
a ~ dnorm(0, .0001)
b ~ dnorm(0, .0001)
for (i in 1:N) {
# passing the linear combination through logit function
logit(p[i]) <- a + b * x[i]
# likelihood function
y[i] ~ dbern(p[i])
}
}
Wie Sie sehen können, wird der Code direkt in die Modelldefinition übersetzt. Die Software zeichnet einige Werte aus normalen Prioritäten für a
und b
verwendet diese Werte dann zur Schätzung p
und schließlich die Wahrscheinlichkeitsfunktion, um zu bewerten, wie wahrscheinlich Ihre Daten bei diesen Parametern sind (dies ist, wenn Sie den Bayes-Satz verwenden, siehe hier für detailliertere Beschreibung).
Das grundlegende logistische Regressionsmodell kann erweitert werden, um die Abhängigkeit zwischen den Prädiktoren mithilfe eines hierarchischen Modells (einschließlich Hyperprioren ) zu modellieren . In diesem Fall können Sie aus der multivariaten Normalverteilung ziehen , wodurch wir Informationen über die Kovarianz zwischen unabhängigen Variablen können ΣβiΣ
⎛⎝⎜⎜⎜⎜β0β1⋮βk⎞⎠⎟⎟⎟⎟∼MVN⎛⎝⎜⎜⎜⎜⎜⎡⎣⎢⎢⎢⎢μ0μ1⋮μk⎤⎦⎥⎥⎥⎥,⎡⎣⎢⎢⎢⎢⎢σ20σ1,0⋮σk,0σ0,1σ21⋮σk,1……⋱…σ0,kσ1,k⋮σ2k⎤⎦⎥⎥⎥⎥⎥⎞⎠⎟⎟⎟⎟⎟
... aber das geht ins Detail, also lasst uns gleich hier aufhören.
Der "Bayes'sche" Teil hier ist die Auswahl von Prioritäten unter Verwendung des Bayes-Theorems und die Definition des Modells in probabilistischen Begriffen. Hier finden Sie die Definition des "Bayes'schen Modells" und hier eine allgemeine Einführung in den Bayes'schen Ansatz . Sie können auch feststellen, dass das Definieren von Modellen mit diesem Ansatz ziemlich einfach und flexibel ist.
Kruschke, JK, Aguinis, H. & Joo, H. (2012). Es ist an der Zeit: Bayesianische Methoden zur Datenanalyse in den Organisationswissenschaften. Organizational Research Methods, 15 (4), 722 & ndash; 752.
Gelman, A., Jakulin, A., Pittau, GM und Su, Y.-S. (2008). Eine schwach informative Standard-Vorverteilung für logistische und andere Regressionsmodelle. The Annals of Applied Statistics, 2 (4), 1360–1383.