Cox-Regression und Zeitskala


9

Muss die Variable X (Hazard) in der Cox-Proportional-Hazard-Regressionsanalyse immer Zeit sein? Wenn nicht, können Sie bitte ein Beispiel nennen?

Kann das Alter eines Krebspatienten eine Gefahrenvariable sein? Wenn ja, kann dies als das Risiko interpretiert werden, in einem bestimmten Alter an Krebs zu erkranken? Wäre die Cox-Regression eine legitime Analyse, um den Zusammenhang zwischen Genexpression und Alter zu untersuchen?

Antworten:


8

Normalerweise wird das Alter zu Studienbeginn als Kovariate verwendet (weil es häufig mit Krankheit / Tod verbunden ist), aber es kann auch als Zeitskala verwendet werden (ich denke, es wird in einigen Längsschnittstudien verwendet, weil Sie genug haben müssen Personen, die entlang der Zeitskala einem Risiko ausgesetzt sind, aber ich kann mich nicht erinnern - ich habe gerade diese Folien über die Analyse von Kohortenstudien unter der Annahme einer kontinuierlichen Zeitskala gefunden, die über Kohortenstudien sprechen. In der Interpretation sollten Sie die Ereigniszeit durch das Alter ersetzen und das Alter bei der Diagnose als Kovariate angeben. Dies ist sinnvoll, wenn Sie die altersspezifische Mortalität einer bestimmten Krankheit untersuchen (wie in diesen Folien dargestellt ).

Vielleicht ist dieser Artikel interessant, da er die beiden Ansätze "Studienzeit" und "chronologisches Alter" gegenüberstellt: Zeitskalen im Cox-Modell: Auswirkung der Variabilität zwischen den Eintrittsaltern auf die Koeffizientenschätzungen . Hier ist ein weiteres Papier:

Cheung, YB, Gao, F und Khoo, KS (2003). Alter bei Diagnose und Wahl der Überlebensanalysemethoden in der Krebsepidemiologie . Journal of Clinical Epidemiology , 56 (1), 38-43.

Aber es gibt sicherlich bessere Papiere.


@chi: Vielen Dank. Ich werde die Papiere schauen. Würden Sie bitte die erste Frage kommentieren? Ist die Gefahrenvariable immer zeitlich?
Yuk

@yuk Nicht unbedingt, wie von @whuber vorgeschlagen. Ich denke an eine andere Anwendung der Cox-Regression, die sich mit der Behandlung systematischer Muster fehlender Antworten in pädagogischen Tests befasst, da sie auftritt, wenn ein Schüler nicht genügend Zeit hat, um den Test abzuschließen (fehlende Antworten können dann als richtig zensiert angesehen werden). - In diesem Fall ist dies die Artikelbestellung, die als Zeitskala betrachtet wird. Ich werde mir das Originalpapier ansehen (obwohl ich denke, dass dies auch Gegenstand einer Promotion war).
Chl

+1. Es gibt andere Papiere, aber ich bin nicht sicher, ob sie unbedingt besser sind. Ich denke, Chalise macht einen ziemlich guten Job, um die Situation zusammenzufassen.
Ars

7

Nein, es muss nicht immer Zeit sein. Viele zensierte Antworten können mit Überlebensanalysetechniken modelliert werden. In seinem Buch Nondetects and Data Analysis befürwortet Dennis Helsel die Verwendung des Negativs einer Konzentration anstelle der Zeit (um mit Nondetects umzugehen, die, wenn sie negiert werden, zu rechtszensierten Werten werden). Eine Zusammenfassung ist im Web verfügbar (PDF-Format), und ein R-Paket, NADA , implementiert dies.


+1, danke für den Hinweis auf das NADA-Paket. Mir ist aufgefallen, dass es einfacher ist, linkszensierte Daten über das Überlebenspaket zu verarbeiten. Ist linkszensiert ein häufiges Szenario mit Umweltdaten?
Ars

@whuber: Danke für den Kommentar, das NADA-Paket sieht sehr interessant aus.
Yuk

@Andy: Danke für die Links. Ich denke, es lohnt sich, eine Antwort zu sein. Ich würde zustimmen.
Yuk

@Yuk, auf deine Bitte hin habe ich meinen Kommentar zu einer Antwort gemacht und @whuber danke für dein Beispiel.
Andy W

@ars: Ja, die linke Zensur ist charakteristisch für Umweltdaten (und ein zentrales Anliegen der Chemometrie im Allgemeinen). Es ist ein kniffliges und interessantes Problem. Zu den Gründen gehören: (1) Die Zensurgrenzen werden selbst durch statistische Schätzungen (durch einen Kalibrierungsprozess) bestimmt. (2) Die Zensur kann auf verschiedene Arten erfolgen - als Nachweisgrenzen, Bestimmungsgrenzen oder "Berichtsgrenzen". 3) Die Schwellenwerte variieren häufig als Reaktion auf Kovariaten ("Matrixinterferenzen"), die stark mit den ursprünglichen zensierten Werten korreliert werden können. (4) Daten sind häufig logarithmisch normal verteilt.
whuber

4

In Bezug auf die Alters- und Zeitskala verfügt chl über einige gute Referenzen und erfasst das Wesentliche - insbesondere die Anforderung, dass das Risikoset genügend Probanden aller Altersgruppen enthält, wie dies in einer Längsschnittstudie der Fall wäre.

Ich möchte nur darauf hinweisen, dass diesbezüglich noch kein allgemeiner Konsens besteht, aber es gibt Literatur, die darauf hinweist, dass in bestimmten Fällen das Alter als Zeitskala bevorzugt werden sollte. Insbesondere wenn Sie eine Situation haben, in der sich die Zeit nicht für alle Probanden auf die gleiche Weise ansammelt, z. B. aufgrund der Exposition gegenüber toxischem Material, ist das Alter möglicherweise angemessener.

Auf der anderen Seite können Sie dieses spezielle Beispiel auf einem Cox PH-Modell im Zeitmaßstab behandeln, indem Sie das Alter als zeitvariable Kovariate verwenden - und nicht als feste Kovariate zur Startzeit. Sie müssen über den Mechanismus hinter Ihrem Untersuchungsobjekt nachdenken, um herauszufinden, welche Zeitskala besser geeignet ist. Manchmal lohnt es sich, beide Modelle an vorhandene Daten anzupassen, um festzustellen, ob Unstimmigkeiten auftreten und wie diese erklärt werden können, bevor Sie Ihre neue Studie entwerfen.

Schließlich besteht der offensichtliche Unterschied bei der Analyse der beiden darin, dass die Interpretation des Überlebens auf einer Altersskala in Bezug auf eine absolute Skala (Alter) erfolgt, während sie auf einer Zeitskala relativ zum Start- / Eintrittsdatum der Studie ist .


3

Auf Wunsch des OP ist hier eine andere Anwendung, bei der ich eine Überlebensanalyse in einem räumlichen Kontext gesehen habe (obwohl sie sich offensichtlich von der Messung der von whuber erwähnten Umweltsubstanzen unterscheidet), die Modellierung der Entfernung zwischen Ereignissen im Raum. Hier ist ein Beispiel in der Kriminologie und hier ist eines in der Epidemiologie .

Die Gründe für die Verwendung der Überlebensanalyse zur Messung der Entfernung zwischen Ereignissen sind nicht unbedingt ein Problem der Zensur (obwohl die Zensur definitiv in einem räumlichen Kontext auftreten kann), sondern eher aufgrund der ähnlichen Verteilung zwischen Zeit- und Ereignismerkmalen und der Entfernung zwischen Ereignissen Eigenschaften (dh beide haben ähnliche Arten von Fehlerstrukturen (häufig Abstandszerfall), die gegen OLS verstoßen, und daher sind die nichtparametrischen Lösungen für beide ideal).


Aufgrund meiner schlechten Zitierpraktiken musste ich stundenlang den richtigen Link / Verweis auf den obigen Link finden.

Für das Beispiel in der Kriminologie

Kikuchi, George, Mamoru Amemiya, Tomonori Saito, Takahito Shimada und Yutaka Harada. 2010. Eine räumlich-zeitliche Analyse der nahezu wiederholten Viktimisierung in Japan . 8. Nationale Konferenz zur Kartierung von Straftaten. Jill Dando Institut für Kriminalwissenschaft. PDF derzeit auf der angegebenen Webseite verfügbar.

In der Epidemiologie

Leser, Steven. 2000. Verwendung der Überlebensanalyse zur Untersuchung räumlicher Punktmuster in der geografischen Epidemiologie. Social Science & Medicine 50 (7-8): 985-1000.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.