Interpretation von log-transformierten Prädiktoren in der logistischen Regression


15

Einer der Prädiktoren in meinem Logistikmodell wurde logtransformiert. Wie interpretieren Sie den geschätzten Koeffizienten des logarithmisch transformierten Prädiktors und wie berechnen Sie den Einfluss dieses Prädiktors auf die Odds Ratio?



1
Eine sehr klare, umfassende Behandlung dieser Frage ist die Antwort von jthetzel
rolando2

Danke für deine Hilfe. Eine weitere Klarstellung. Tatsächlich macht es intuitiv Sinn, dass eine Verdoppelung des Prädiktors zu einer Änderung des Ergebnisses in Axt% führt, wenn ich zur Logarithmusbasis 2 transformiere .
mp77

Antworten:


16

Wenn Sie den geschätzten Koeffizienten potenzieren, erhalten Sie ein Quotenverhältnis, das mit einer fachen Erhöhungb des Prädiktors verbunden ist, wobei die Basis des Logarithmus ist, den Sie bei der logarithmischen Transformation des Prädiktors verwendet haben.b

Normalerweise nehme ich in dieser Situation Logarithmen zur Basis 2, damit ich den potenzierten Koeffizienten als Odds Ratio interpretieren kann, das mit einer Verdopplung des Prädiktors verbunden ist.


3
Interessant. Ich verwende immer natürliche Protokolle, da viele der Koeffizienten dazu neigen, nahe Null zu sein und dann als proportionale (relative) Differenzen interpretiert werden können. Das ist in keiner anderen Logarithmusbasis möglich. Ich sehe einige Vorteile darin, andere Grundlagen zu verwenden, aber ich denke, Sie müssen Ihre Antwort klarer formulieren , da auf den ersten Blick bei Ihrer Interpretation der Wert des Koeffizienten überhaupt nicht verwendet wird!
whuber

@whuber sorry was bedeutet prima facie ? Erstes Gesicht ??
Onestop


8

@gung ist völlig korrekt, aber falls Sie sich entscheiden, es beizubehalten , können Sie den Koeffizienten so interpretieren, dass er sich auf jedes Vielfache der IV und nicht auf jede Addition der IV auswirkt .

Eine IV, die oft transformiert werden sollte, ist das Einkommen. Wenn Sie es untransformiert einbeziehen, wirkt sich jede (sagen wir) Erhöhung des Einkommens um 1.000 USD auf die Gewinnchancenquote aus, die durch die Gewinnchancenquote angegeben wird. Wenn Sie dagegen log (10) des Einkommens nehmen, hat jede 10-fache Erhöhung des Einkommens Auswirkungen auf die im Odds Ratio angegebene Odds Ratio.

Es ist sinnvoll, dies für das Einkommen zu tun, da eine Einkommenssteigerung von 1.000 US-Dollar in vielerlei Hinsicht für jemanden, der 10.000 US- Dollar pro Jahr verdient, viel größer ist als für jemanden, der 100.000 US-Dollar verdient.

Eine letzte Anmerkung: Obwohl die logistische Regression keine Normalitätsannahmen trifft, trifft selbst die OLS-Regression keine Annahmen über die Variablen, sondern Annahmen über den Fehler, wie durch die Residuen geschätzt.


1
+1, gute Punkte. Ich glaube, ich hätte vollständiger sein können. Außerdem habe ich den versehentlichen Mathjax ausgeschaltet, indem ich einen Backslash "\" direkt vor die Dollarzeichen gesetzt habe. Ich hoffe es macht dir nichts aus.
gung - Wiedereinsetzung von Monica

Was meinen Sie mit "logistische Regression macht Vermutung über die Fehler"?

Nein, die OLS-Regression geht von Fehlern aus. Das ist, was ich gesagt habe.
Peter Flom - Wiedereinsetzung von Monica

3

Diese Antwort stammt aus The Statistical Sleuth von Fred L. Ramsey und Daniel W. Schafer.

Wenn Ihre Modellgleichung lautet:

log(p/(1p))=β0+βlog(X)

kXkβ

Zum Beispiel habe ich das folgende Modell für das Vorhandensein von Wunden im Bett, die sich über die Dauer des Krankenhausaufenthalts zurückgebildet haben.

log(oddsofbedsore)=.44+0.45(lengthofstay)

β=0.45

k

k=2

kβ=20.45=1.37

k=2

k=0.5

kβ=0.50.45=0.73

k=0.5

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.