Dies ist ein Problem, das mich seit langem geplagt hat und in Lehrbüchern, Google oder Stack Exchange keine guten Antworten gefunden hat.
Ich habe einen Datensatz von> 100.000 Patienten, für die vier Behandlungen verglichen werden. Die Forschungsfrage ist, ob das Überleben zwischen diesen Behandlungen unterschiedlich ist, nachdem eine Reihe klinischer / demografischer Variablen berücksichtigt wurden. Die nicht angepasste KM-Kurve ist unten.
Nicht proportionale Gefahren wurden durch jede von mir verwendete Methode angezeigt (z. B. nicht angepasste log-log-Überlebenskurven sowie Wechselwirkungen mit der Zeit und die Korrelation von Schönfield-Residuen und eingestufter Überlebenszeit, die auf angepassten Cox-PH-Modellen basierten). Die Log-Log-Überlebenskurve ist unten. Wie Sie sehen können, ist die Form der Nichtproportionalität ein Chaos. Obwohl keiner der Zwei-Gruppen-Vergleiche isoliert zu schwierig zu handhaben wäre, verwirrt mich die Tatsache, dass ich sechs Vergleiche habe, wirklich. Ich vermute, dass ich nicht alles in einem Modell bewältigen kann.
Ich suche nach Empfehlungen, wie ich mit diesen Daten umgehen soll. Die Modellierung dieser Effekte mit einem erweiterten Cox-Modell ist angesichts der Anzahl der Vergleiche und der unterschiedlichen Formen der Nichtproportionalität wahrscheinlich nicht möglich. Da sie an Behandlungsunterschieden interessiert sind, ist ein geschichtetes Gesamtmodell keine Option, da ich diese Unterschiede nicht abschätzen kann.
Zögern Sie nicht, mich auseinander zu reißen, aber ich dachte darüber nach, zunächst ein geschichtetes Modell zu schätzen, um die Auswirkungen der anderen Kovariaten zu erhalten (natürlich die Annahme, dass keine Interaktion vorliegt), und dann für jedes Modell mehrere multivariable Cox-Modelle neu zu schätzen Zwei-Gruppen-Vergleich (also 6 Gesamtmodelle). Auf diese Weise kann ich die Form der Nichtproportionalität für jeden Zwei-Gruppen-Vergleich ansprechen und weniger falsch geschätzte HRs erhalten. Ich verstehe, dass die Standardfehler voreingenommen wären, aber angesichts der Stichprobengröße wird wahrscheinlich alles "statistisch" signifikant sein.