iKεi,kXiεi,kkXi
Dies wird im folgenden Teil des entsprechenden Wikipedia- Artikels erläutert :
Es ist auch möglich, eine multinomiale logistische Regression als ein latentes Variablenmodell zu formulieren, das dem für die binäre logistische Regression beschriebenen bidirektionalen latenten Variablenmodell folgt. Diese Formulierung ist in der Theorie der diskreten Auswahlmodelle üblich und erleichtert den Vergleich der multinomialen logistischen Regression mit dem zugehörigen multinomialen Probit-Modell sowie dessen Erweiterung auf komplexere Modelle.
ikY∗i,k
Y∗i,1Y∗i,2⋯Y∗i,K=β1⋅Xi+ε1=β2⋅Xi+ε2=βK⋅Xi+εK
εk∼EV1(0,1),
ikYikY∗i,kk
Pr(Yi=1)Pr(Yi=2)⋯Pr(Yi=K)=Pr(Y∗i,1>Y∗i,2 and Y∗i,1>Y∗i,3 and ⋯ and Y∗i,1>Y∗i,K)=Pr(Y∗i,2>Y∗i,1 and Y∗i,2>Y∗i,3 and ⋯ and Y∗i,2>Y∗i,K)=Pr(Y∗i,K>Y∗i,1 and Y∗i,K>Y∗i,2 and ⋯ and Y∗i,K>Y∗i,K−1)
Oder äquivalent:
Pr(Yi=1)Pr(Yi=2)⋯Pr(Yi=K)=Pr(max(Y∗i,1,Y∗i,2,…,Y∗i,K)=Y∗i,1)=Pr(max(Y∗i,1,Y∗i,2,…,Y∗i,K)=Y∗i,2)=Pr(max(Y∗i,1,Y∗i,2,…,Y∗i,K)=Y∗i,K)
Bearbeiten:
Manchmal sieht die Schreibweise so aus:
wobei bedeutet, dass das Individuum die Wahl trifft, ist ziemlich präzise, sobald die entsprechende Notation definiert ist. Wenn Sie nach einer nützlichen Möglichkeit suchen, dies in eine Wahrscheinlichkeitsfunktion umzusetzen, sehen Sie möglicherweise :
wobei eine Indikatorfunktion ist, die gleich 1 ist, wenn die Wahl und ansonsten Null und wähle
Pr(i→k)=Pr(max(Y∗i,1,Y∗i,2,…,Y∗i,K)=Y∗i,k),
i→kikPi=∏k=1KPr(i→k)1i→k,
1i→kikPiist die PMF der Beobachtung, die mit dem Individuum assoziiert ist .
i
Bearbeiten 2:
Eine explizite Formel finden Sie im gleichen Wikipedia-Artikel. Schauen Sie sich zum Beispiel den folgenden Abschnitt an:
Folglich ist es üblich, (oder alternativ einen der anderen Koeffizientenvektoren) zu setzen. Im Wesentlichen setzen wir die Konstante so, dass einer der Vektoren zu 0 wird und alle anderen Vektoren in die Differenz zwischen diesen Vektoren und dem von uns gewählten Vektor transformiert werden. Dies ist gleichbedeutend mit dem "Schwenken" um eine der Entscheidungen und dem Untersuchen, wie viel besser oder schlechter alle anderen Entscheidungen im Verhältnis zu den Entscheidungen sind, die sich drehen. Mathematisch transformieren wir die Koeffizienten wie folgt:C=−βKKK−1
β′1⋯β′K−1β′K=β1−βK⋯=βK−1−βK=0
Dies führt zu folgenden Gleichungen:
Pr(Yi=1)⋯Pr(Yi=K−1)Pr(Yi=K)=eβ′1⋅Xi1+∑K−1k=1eβ′k⋅Xi⋯=eβ′K−1⋅Xi1+∑K−1k=1eβ′k⋅Xi=11+∑K−1k=1eβ′k⋅Xi