R.2(in einer anderen Antwort beschrieben) ist, dass es sehr stark von der Zensurverteilung Ihrer Daten abhängt. Andere natürliche Dinge, die Sie möglicherweise betrachten, wie das Wahrscheinlichkeitsverhältnis zum Nullmodell, haben ebenfalls dieses Problem. (Dies liegt im Wesentlichen daran, dass sich der Beitrag eines zensierten Datenpunkts zur Wahrscheinlichkeit stark vom Beitrag eines Datenpunkts unterscheidet, an dem das Ereignis beobachtet wird, da einer von ihnen aus einem PDF und einer von einem CDF stammt.) Verschiedene Forscher haben Vorgeschlagene Wege, um dies zu umgehen, aber die, die ich gesehen habe, erfordern normalerweise, dass Sie ein Modell der Zensurverteilung oder etwas ähnlich Unpraktisches haben. Ich habe nicht untersucht, wie schlimm diese Abhängigkeit in der Praxis ist. Wenn Ihre Zensur also recht gering ist, können Sie sich dennoch mit Statistiken befassen, die auf dem Wahrscheinlichkeitsverhältnis basieren. Für Überlebens-CART-Modelle,
τist auch weniger empfindlich als die oben genannten Statistiken, sodass Sie möglicherweise nicht zwischen darauf basierenden Modellen wählen möchten, wenn der Unterschied zwischen ihnen gering ist. Es ist nützlicher als ein interpretierbarer Index der allgemeinen Leistung als eine Möglichkeit, verschiedene Modelle zu vergleichen.
(Schließlich können Sie natürlich, wenn Sie einen bestimmten Zweck für die Modelle im Auge haben - das heißt, wenn Sie wissen, was Ihre Vorhersageverlustfunktion ist -, sie immer nach der Verlustfunktion bewerten! Aber ich vermute, Sie ' Ich bin nicht so glücklich ...)
Für eine eingehendere Diskussion sowohl der Likelihood-Ratio-Statistiken als auch von Harrells c sollten Sie sich Harrells hervorragende Lehrbuch- Regressionsmodellierungsstrategien ansehen . Der Abschnitt zur Bewertung von Überlebensmodellen ist §19.10, S. 492-493. Es tut mir leid, dass ich Ihnen keine endgültige Antwort geben kann, aber ich denke nicht, dass dies ein gelöstes Problem ist!