Wir werden eine Weile brauchen , um dorthin zu gelangen, aber zusammenfassend multipliziert eine Änderung der Variable, die B entspricht , um eine Einheit das relative Risiko des Ergebnisses (im Vergleich zum Basisergebnis) mit 6,012.
Man könnte dies als einen Anstieg des relativen Risikos um "5012%" ausdrücken , aber das ist eine verwirrende und möglicherweise irreführende Methode, da dies nahelegt, dass wir uns die Änderungen additiv überlegen sollten, wenn uns das multinomiale Logistikmodell tatsächlich nachdrücklich dazu ermutigt multiplikativ denken. Der Modifikator "relativ" ist wichtig, da durch eine Änderung einer Variablen gleichzeitig die vorhergesagten Wahrscheinlichkeiten aller Ergebnisse geändert werden , nicht nur die fraglichen. Daher müssen wir Wahrscheinlichkeiten vergleichen (anhand von Verhältnissen, nicht Differenzen).
Der Rest dieser Antwort enthält die Terminologie und Intuition, die zur korrekten Interpretation dieser Aussagen erforderlich sind.
Hintergrund
Beginnen wir mit der normalen logistischen Regression, bevor wir zum multinomialen Fall übergehen.
Für die abhängige (binäre) Variable und die unabhängigen Variablen lautet das ModellX iYXi
Pr[Y=1]=exp(β1X1+⋯+βmXm)1+exp(β1X1+⋯+βmXm);
äquivalent unter der Annahme ,0≠Pr[Y=1]≠1
Log( ρ ( X1, ⋯ , Xm) ) = logPr [ Y= 1 ]Pr [ Y= 0 ]= β1X1+ ⋯ + βmXm.
(Dies definiert einfach , das ist die Quote als Funktion von .)X iρXich
Indizieren Sie der Allgemeinheit so, dass die Variable und das "B" in der Frage ist (damit ). Das Fixieren der Werte von und das Variieren von um einen kleinen Betrag ergibtX m β m exp ( β m ) = 6,012 X i , 1 ≤ i < m X m δXichXmβmexp( βm) = 6,012Xich, 1 ≤ i < mXmδ
Log( ρ ( ⋯ , Xm+ δ) ) - log( ρ ( ⋯ , Xm) ) = βmδ.
Somit ist die marginale Änderung der Log-Quoten in Bezug auf .x mβm Xm
Um , müssen wir offensichtlich und die linke Seite :δ = 1exp( βm)δ= 1
exp( βm)= exp( βm× 1 )= exp( log( ρ ( ⋯ , Xm+ 1 ) ) - log( ρ ( ⋯ , Xm) ) )= ρ ( ⋯ , Xm+ 1 )ρ ( ⋯ , Xm).
Dies zeigt als Odds Ratio für einen Anstieg von um eine Einheit . Um eine Vorstellung davon zu entwickeln, was dies bedeuten könnte, tabellieren Sie einige Werte für einen Bereich von Startquoten, und runden Sie sie stark ab, um die Muster hervorzuheben:X mexp( βm)Xm
Starting odds Ending odds Starting Pr[Y=1] Ending Pr[Y=1]
0.0001 0.0006 0.0001 0.0006
0.001 0.006 0.001 0.006
0.01 0.06 0.01 0.057
0.1 0.6 0.091 0.38
1. 6. 0.5 0.9
10. 60. 0.91 1.
100. 600. 0.99 1.
Bei sehr kleinen Gewinnchancen, die sehr kleinen Wahrscheinlichkeiten entsprechen, bewirkt eine Erhöhung von um eine Einheit , dass die Gewinnchancen oder die Wahrscheinlichkeit mit etwa 6,012 multipliziert werden. Der multiplikative Faktor nimmt mit zunehmender Wahrscheinlichkeit ab und ist im Wesentlichen verschwunden, sobald die Wahrscheinlichkeit 10 überschreitet (die Wahrscheinlichkeit 0,9 überschreitet).Xm
Als additive Änderung gibt es keinen großen Unterschied zwischen einer Wahrscheinlichkeit von 0,0001 und 0,0006 (es ist nur 0,05%), noch gibt es einen großen Unterschied zwischen 0,99 und 1 (nur 1%). Der größte additive Effekt tritt auf, wenn die Quote , wobei sich die Wahrscheinlichkeit von 29% auf 71% ändert: eine Änderung von + 42%.1 / 6.012----√~ 0.408
Wir sehen also, dass, wenn wir "Risiko" als Odds Ratio ausdrücken, = "B" eine einfache Interpretation hat - das Odds Ratio ist gleich für eine Einheitserhöhung von aber wenn wir in einigen Fällen Risiko ausdrücken Auf andere Weise, beispielsweise bei einer Änderung der Wahrscheinlichkeiten, erfordert die Interpretation Sorgfalt bei der Angabe der Startwahrscheinlichkeit.β m X mβmβmXm
Multinomiale logistische Regression
(Dies wurde als spätere Bearbeitung hinzugefügt.)
Nachdem wir den Wert der Verwendung von log Odds zur Darstellung von Chancen erkannt haben, gehen wir zum multinomialen Fall über. Nun kann die abhängige Variable einer von Kategorien entsprechen, indiziert durch . Die relative Wahrscheinlichkeit, dass es in der Kategorie ist, istk ≥ 2 i = 1 , 2 , … , k iY.k ≥ 2i = 1 , 2 , ... , kich
Pr [ Yich] ∼ exp( β( i )1X1+ ⋯ + β( i )mXm)
mit zu bestimmenden Parametern und Schreiben von für . Als Abkürzung schreiben wir den rechten Ausdruck als oder, wenn und aus dem Kontext hervorgehen, einfach als . Das Normalisieren, um alle diese relativen Wahrscheinlichkeiten zur Summe zu machen, ergibt die Einheit Y i Pr [ Y = Kategorie i ] p i ( X , β ) X β p iβ( i )jY.ichPr [ Y= Kategorie i ]pich( X, β)Xβpich
Pr [ Yich] = pich( X, β)p1( X, β) + ⋯ + pm( X, β).
(Die Parameter sind nicht eindeutig: Es gibt zu viele. Normalerweise wählt man eine "Basis" -Kategorie zum Vergleich und zwingt alle ihre Koeffizienten auf Null. Dies ist jedoch erforderlich, um eindeutige Schätzungen der Betas zu melden.) Es ist nicht erforderlich, die Koeffizienten zu interpretieren. Um die Symmetrie beizubehalten, dh künstliche Unterscheidungen zwischen den Kategorien zu vermeiden, sollten wir keine solche Einschränkung erzwingen, es sei denn, wir müssen.)
Eine Möglichkeit zur Interpretation dieses Modells besteht darin, die marginale Änderungsrate der Log-Quoten für eine Kategorie (z. B. Kategorie ) in Bezug auf eine der unabhängigen Variablen (z. B. ) . Das heißt, wenn wir ein wenig ändern, führt dies zu einer Änderung der Log-Quoten von . Wir sind an der Proportionalitätskonstante interessiert, die diese beiden Änderungen miteinander verbindet. Die Kettenregel des Kalküls sagt uns zusammen mit einer kleinen Algebra, dass diese Änderungsrate istX j X j Y iichXjXjY.ich
∂ Log Quoten ( Yich)∂ Xj= β( i )j- β( 1 )jp1+ ⋯ + β( i - 1 )jpi - 1+ β( i + 1 )jpi + 1+ ⋯ + β( k )jpkp1+ ⋯ + pi - 1+ pi + 1+ ⋯ + pk.
Dies hat eine relativ einfache Interpretation als der Koeffizient von in der Formel für die Wahrscheinlichkeit, dass in der Kategorie minus einer "Anpassung" ist. Die Anpassung ist der wahrscheinlichkeitsgewichtete Durchschnitt der Koeffizienten von in allen anderen Kategorien . Die Gewichte werden unter Verwendung von Wahrscheinlichkeiten berechnet, die den aktuellen Werten der unabhängigen Variablen . Daher ist die marginale Änderung der Protokolle nicht unbedingt konstant: Sie hängt von den Wahrscheinlichkeiten aller anderen Kategorien ab, nicht nur von der Wahrscheinlichkeit der betreffenden Kategorie (Kategorie ). X j Y i X j X iβ( i )jXjY.ichXjXich
Wenn es nur Kategorien gibt, sollte sich dies auf eine normale logistische Regression reduzieren. In der Tat hat die Wahrscheinlichkeitsgewichtung keine Auswirkung und (Auswahl von ) ergibt einfach die Differenz . Wenn die Kategorie der Basisfall ist, wird dies weiter auf reduziert , da wir erzwingen . So verallgemeinert die neue Interpretation die alte.i = 2 β ( 2 ) j - β ( 1 ) j i β ( 2 ) j β ( 1 ) j = 0k = 2i = 2β( 2 )j- β( 1 )jichβ( 2 )jβ( 1 )j= 0
Um direkt zu interpretieren , werden wir es auf einer Seite der vorhergehenden Formel isolieren, was zu Folgendem führt:β( i )j
Der Koeffizient der für die Klasse die marginale Veränderung ist gleich in den Log - Odds der Kategorie in Bezug auf die variable , sowie die Wahrscheinlichkeit gewichtete Durchschnitt der Koeffizienten aller anderen für die Klasse . i i X j X j ' iXjichichXjXj′ich
Eine andere Interpretation, wenn auch etwas weniger direkt, ergibt sich, wenn die Kategorie (vorübergehend) als Basisfall festgelegt wird, wodurch für alle unabhängigen Variablen :β ( i ) j = 0 X jichβ( i )j= 0Xj
Die marginale Änderungsrate der logarithmischen Quoten des Basisfalls für die Variable ist das Negative des wahrscheinlichkeitsgewichteten Durchschnitts seiner Koeffizienten für alle anderen Fälle.Xj
Das Verwenden dieser Interpretationen erfordert normalerweise das Extrahieren der Betas und der Wahrscheinlichkeiten aus der Software-Ausgabe und das Ausführen der Berechnungen wie gezeigt.
Schließlich ist für die potenzierten Koeffizienten zu beachten, dass das Verhältnis der Wahrscheinlichkeiten zwischen zwei Ergebnissen (manchmal als das "relative Risiko" von Vergleich zu ) isti 'ichich′
Y.ichY.ich′= pich( X, β)pich′( X, β).
Erhöhen wir um eine Einheit auf . Dies multipliziert mit und mit , wobei das relative Risiko mit multipliziert wird. = . Wird die Kategorie als Basisfall herangezogen, reduziert sich dies auf , was uns dazu veranlasst zu sagen,X j + 1 p iXjXj+ 1piexp(β(i)j)pi′exp(β(i′)j)exp(β(i)j)/exp(β(i′)j)i ' exp ( β ( i ) j )exp(β(i)j−β(i′)j)i′exp(β(i)j)
Der potenzierte Koeffizient ist der Betrag, mit dem das relative Risiko multipliziert wird wenn die Variable um eine Einheit erhöht wird.Pr [ Y = Kategorie i ] / Pr [ Y = Basiskategorie ] X jexp(β(i)j)Pr[Y=category i]/Pr[Y=base category]Xj