Wenn Sie die parametrische Verteilung kennen, der Ihre Daten folgen, verwenden Sie einen Maximum-Likelihood-Ansatz, und die Verteilung ist sinnvoll. Der eigentliche Vorteil der Cox Proportional Hazards-Regression besteht darin, dass Sie Überlebensmodelle anpassen können, ohne die Verteilung zu kennen (oder anzunehmen). Sie geben ein Beispiel unter Verwendung der Normalverteilung an, aber die meisten Überlebenszeiten (und andere Arten von Daten, für die die Cox-PH-Regression verwendet wird) kommen einer Normalverteilung nicht nahe. Einige folgen möglicherweise einer logarithmischen Normalverteilung, einer Weibullverteilung oder einer anderen parametrischen Verteilung, und wenn Sie bereit sind, diese Annahme zu treffen, ist der parametrische Ansatz mit maximaler Wahrscheinlichkeit groß. In vielen Fällen der realen Welt wissen wir jedoch nicht, wie die geeignete Verteilung aussieht (oder auch nur annähernd genug). Mit Zensur und Kovariaten können wir kein einfaches Histogramm erstellen und sagen "das sieht für mich nach einer ... Verteilung aus". Daher ist es sehr nützlich, eine Technik zu haben, die gut funktioniert, ohne eine bestimmte Distribution zu benötigen.
Warum die Gefahr anstelle der Verteilungsfunktion verwenden? Betrachten Sie die folgende Aussage: "Die Wahrscheinlichkeit, dass Menschen in Gruppe A im Alter von 80 Jahren sterben, ist doppelt so hoch wie in Gruppe B". Dies könnte der Fall sein, weil die Menschen in Gruppe B tendenziell länger leben als die in Gruppe A, oder weil die Menschen in Gruppe B tendenziell kürzer leben und die meisten von ihnen lange vor ihrem 80. Lebensjahr gestorben sind, was eine sehr geringe Wahrscheinlichkeit darstellt von ihnen sterben mit 80, während genug Menschen in Gruppe A bis zu 80 leben, so dass eine angemessene Anzahl von ihnen in diesem Alter sterben wird, was zu einer viel höheren Wahrscheinlichkeit des Todes in diesem Alter führt. Dieselbe Aussage könnte also bedeuten, dass es besser oder schlechter ist, in Gruppe A zu sein als in Gruppe B. Sinnvoller ist, von den Menschen (in jeder Gruppe), die 80 Jahre alt waren, zu sagen, welcher Anteil vor ihrem 81. Lebensjahr sterben wird. Das ist die Gefahr (und die Gefahr ist eine Funktion der Verteilungsfunktion / Überlebensfunktion / etc.) Die Gefahr ist im semiparametrischen Modell einfacher zu handhaben und kann Ihnen dann Informationen über die Verteilung geben.