Die logistische Regression kann als lineare Kombination beschrieben werden
η=β0+β1X1+...+βkXk
das wird durch die Verknüpfungsfunktion :g
g(E(Y))=η
Dabei ist die Link-Funktion eine Logit- Funktion
E(Y|X,β)=p=logit−1(η)
Dabei nimmt nur Werte in und inverse Logit-Funktionen transformieren die Linearkombination in diesen Bereich. Hier endet die klassische logistische Regression.{ 0 , 1 } ηY{0,1}η
Wenn Sie sich jedoch daran erinnern, dass für Variablen ist, die nur Werte in annehmen , kann als . In diesem Fall könnte die Ausgabe der Logit-Funktion als bedingte Wahrscheinlichkeit des "Erfolgs" angesehen werden, dh . Die Bernoulli-Verteilung ist eine Verteilung, die die Wahrscheinlichkeit der Beobachtung eines binären Ergebnisses mit einem Parameter beschreibt, sodass wir als beschreiben können{ 0 , 1 } E ( Y | X , β ) P ( Y = 1 | X , β ) P ( Y = 1 | X , β ) p Y.E(Y)=P(Y=1){0,1}E(Y|X,β)P(Y=1|X,β)P(Y=1|X,β)pY
yi∼Bernoulli(p)
Bei der logistischen Regression suchen wir nach einigen Parametern , die zusammen mit unabhängigen Variablen eine lineare Kombination . In der klassischen Regression ist (wir nehmen an, dass die Verknüpfungsfunktion eine Identitätsfunktion ist). Um jedoch zu modellieren , das Werte in annimmt, müssen wir so transformieren, dass es passt im Bereich .X η E ( Y | X , β ) = η Y { 0 , 1 } η [ 0 , 1 ]βXηE(Y|X,β)=ηY{0,1}η[0,1]
Um die logistische Regression auf Bayes'sche Weise abzuschätzen, nehmen Sie einige Prioritäten für Parameter wie bei der linearen Regression (siehe Kruschke et al., 2012 ) und transformieren die lineare Kombination mit der logit-Funktion , um ihre Ausgabe als zu verwenden Parameter der Bernoulli-Verteilung, der Ihre Variable beschreibt. Also, ja, Sie verwenden die Gleichung und die Logit-Link-Funktion tatsächlich auf die gleiche Weise wie im frequenzistischen Fall, und der Rest funktioniert (z. B. Auswahl von Prioritäten) wie bei der Schätzung der linearen Regression auf Bayes'sche Weise. η p Y.βiηpY
Der einfache Ansatz für die Auswahl von Prioritäten besteht darin, Normalverteilungen (Sie können aber auch andere Verteilungen verwenden, z. B. oder Laplace-Verteilung für ein robusteres Modell) für mit den Parametern und , die voreingestellt oder verwendet werden von hierarchischen Prioritäten . Mit der Modelldefinition können Sie jetzt Software wie JAGS verwenden , um eine Markov-Ketten-Monte-Carlo- Simulation durchzuführen und das Modell zu schätzen. Im Folgenden wird ich JAGS Code für einfaches logistisches Modell Post (Check hier für weitere Beispiele).β i μ i σ 2 itβiμiσ2i
model {
# setting up priors
a ~ dnorm(0, .0001)
b ~ dnorm(0, .0001)
for (i in 1:N) {
# passing the linear combination through logit function
logit(p[i]) <- a + b * x[i]
# likelihood function
y[i] ~ dbern(p[i])
}
}
Wie Sie sehen können, wird der Code direkt in die Modelldefinition übersetzt. Die Software zeichnet einige Werte aus normalen Prioritäten für aund bverwendet diese Werte dann zur Schätzung pund schließlich die Wahrscheinlichkeitsfunktion, um zu bewerten, wie wahrscheinlich Ihre Daten bei diesen Parametern sind (dies ist, wenn Sie den Bayes-Satz verwenden, siehe hier für detailliertere Beschreibung).
Das grundlegende logistische Regressionsmodell kann erweitert werden, um die Abhängigkeit zwischen den Prädiktoren mithilfe eines hierarchischen Modells (einschließlich Hyperprioren ) zu modellieren . In diesem Fall können Sie aus der multivariaten Normalverteilung ziehen , wodurch wir Informationen über die Kovarianz zwischen unabhängigen Variablen können ΣβiΣ
⎛⎝⎜⎜⎜⎜β0β1⋮βk⎞⎠⎟⎟⎟⎟∼MVN⎛⎝⎜⎜⎜⎜⎜⎡⎣⎢⎢⎢⎢μ0μ1⋮μk⎤⎦⎥⎥⎥⎥,⎡⎣⎢⎢⎢⎢⎢σ20σ1,0⋮σk,0σ0,1σ21⋮σk,1……⋱…σ0,kσ1,k⋮σ2k⎤⎦⎥⎥⎥⎥⎥⎞⎠⎟⎟⎟⎟⎟
... aber das geht ins Detail, also lasst uns gleich hier aufhören.
Der "Bayes'sche" Teil hier ist die Auswahl von Prioritäten unter Verwendung des Bayes-Theorems und die Definition des Modells in probabilistischen Begriffen. Hier finden Sie die Definition des "Bayes'schen Modells" und hier eine allgemeine Einführung in den Bayes'schen Ansatz . Sie können auch feststellen, dass das Definieren von Modellen mit diesem Ansatz ziemlich einfach und flexibel ist.
Kruschke, JK, Aguinis, H. & Joo, H. (2012). Es ist an der Zeit: Bayesianische Methoden zur Datenanalyse in den Organisationswissenschaften. Organizational Research Methods, 15 (4), 722 & ndash; 752.
Gelman, A., Jakulin, A., Pittau, GM und Su, Y.-S. (2008). Eine schwach informative Standard-Vorverteilung für logistische und andere Regressionsmodelle. The Annals of Applied Statistics, 2 (4), 1360–1383.