Gibt es einen funktionalen Unterschied zwischen einem Odds Ratio und einem Hazard Ratio?


10

Bei der logistischen Regression bedeutet ein Odds Ratio von 2, dass das Ereignis bei einer Erhöhung des Prädiktors um eine Einheit 2-mal wahrscheinlicher ist. Bei der Cox-Regression bedeutet eine Hazard Ratio von 2, dass das Ereignis zu jedem Zeitpunkt doppelt so häufig auftritt, wenn der Prädiktor um eine Einheit erhöht wird. Sind diese nicht praktisch dasselbe?

Was ist dann der Vorteil einer Cox-Regression und der Ermittlung von Hazard Ratios, wenn wir funktional dieselben Informationen aus den Odds Ratios der logistischen Regression erhalten können?

Antworten:


12

Ein Odds Ratio von 2 bedeutet, dass das Ereignis bei einer Erhöhung des Prädiktors um eine Einheit 2-mal wahrscheinlicher ist

Dies bedeutet, dass sich die Gewinnchancen verdoppeln würden, was nicht der Wahrscheinlichkeit einer Verdoppelung entspricht.

Bei der Cox-Regression bedeutet eine Hazard Ratio von 2, dass das Ereignis zu jedem Zeitpunkt doppelt so häufig auftritt, wenn der Prädiktor um eine Einheit erhöht wird.

Abgesehen von ein bisschen Handwinken, ja - die Häufigkeit des Auftretens verdoppelt sich. Es ist wie eine skalierte augenblickliche Wahrscheinlichkeit.

Sind diese nicht praktisch dasselbe?

Sie sind fast dasselbe, wenn die Verdoppelung der Wahrscheinlichkeit des Ereignisses fast gleichbedeutend ist mit der Verdoppelung der Gefahr des Ereignisses. Sie sind nicht automatisch ähnlich, aber unter bestimmten (ziemlich häufigen) Umständen können sie sehr genau übereinstimmen.

Möglicherweise möchten Sie den Unterschied zwischen Gewinnchancen und Wahrscheinlichkeit genauer betrachten.

1223

Vielleicht möchten Sie auch über den Unterschied zwischen Gefahr und Wahrscheinlichkeit nachdenken (siehe meine frühere Diskussion, in der ich das Winken von Hand erwähne; jetzt beschönigen wir den Unterschied nicht). Wenn beispielsweise eine Wahrscheinlichkeit 0,6 beträgt, können Sie sie nicht verdoppeln. Eine sofortige Gefahr von 0,6 kann jedoch auf 1,2 verdoppelt werden. Sie sind nicht dasselbe, genauso wie die Wahrscheinlichkeitsdichte keine Wahrscheinlichkeit ist.


2
h(t)t2×0,6

1
Danke, das ist definitiv relevant. Dies hängt mit der Tatsache zusammen, dass eine diskrete pmf 1 nicht überschreiten kann, während eine Dichte dies definitiv kann.
Glen_b -Rate State Monica

3

Das ist eine gute Frage. Was Sie jedoch wirklich fragen, sollte nicht sein, wie die Statistik interpretiert wird, sondern welche Annahmen jedem Ihrer jeweiligen Modelle zugrunde liegen (Gefahr oder Logistik). Ein logistisches Modell ist ein statisches Modell, das die Wahrscheinlichkeit eines Ereignisses zu einem bestimmten Zeitpunkt bei beobachtbaren Informationen effektiv vorhersagt. Ein Gefährdungsmodell oder Cox-Modell ist jedoch ein Dauer-Modell, das die Überlebensraten über die Zeit modelliert. Sie könnten eine Frage stellen wie "Wie hoch ist die Wahrscheinlichkeit, dass ein Zigarettenkonsument mit Ihrer logistischen Regression bis zum Alter von 75 Jahren überlebt, im Vergleich zu der eines Nichtbenutzers mit Ihrer logistischen Regression" (vorausgesetzt, Sie haben Informationen zur Sterblichkeit für eine Kohorte bis zum Alter von 75 Jahren)? . Wenn Sie jedoch stattdessen die Fülle der Zeitdimension Ihrer Daten nutzen möchten, ist die Verwendung eines Gefährdungsmodells besser geeignet.

Letztendlich kommt es aber wirklich darauf an, was Sie modellieren möchten. Glauben Sie, dass das, was Sie modellieren, ein einmaliges Ereignis ist? Verwenden Sie die Logistik. Wenn Sie glauben, dass Ihr Ereignis eine feste oder proportionale Wahrscheinlichkeit hat, in jedem Zeitraum über ein beobachtbares Zeitspektrum aufzutreten? Verwenden Sie ein Gefahrenmodell.

Die Auswahl der Methoden sollte nicht davon abhängen, wie Sie die Statistik interpretieren. Wenn dies der Fall wäre, gäbe es keinen Unterschied zwischen OLS, LAD, Tobit, Heckit, IV, 2SLS oder einer Vielzahl anderer Regressionsmethoden. Es sollte stattdessen darauf basieren, welche Form das zugrunde liegende Modell, das Sie schätzen möchten, Ihrer Meinung nach annimmt.


-1 (gemischt) Logistische Modelle können sicherlich die Überlebensraten im Zeitverlauf modellieren. Siehe zum Beispiel Allison, PD (1982). Zeitdiskrete Methoden zur Analyse von Ereignisverläufen . Sociological Methodology , 13 (1982), 61–98 oder Allison, PD (1984). Ereignisverlaufsanalyse: Regression für longitudinale Ereignisdaten (Vol. 12). Salbei Beverly Hills, CA.
Alexis
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.