Ein guter Ausgangspunkt für die Untersuchung der univariaten Verteilung wäre der nichtparametrische Maximum Likelihood Estimator (NPMLE). Dies ist eine Verallgemeinerung der Kaplan-Meier-Kurven (die selbst eine Verallgemeinerung der empirischen Verteilungsfunktion ist), die Ihnen eine nicht parametrische Schätzung der kumulativen Verteilungsfunktion gibt. Interessanterweise ist diese Schätzung nicht eindeutig (im Gegensatz zu den EDF- oder Kaplan-Meier-Kurven), sondern bis zu einem bestimmten Intervall bekannt. Sie erhalten also ein Paar Schrittfunktionen, die die NPMLE gebunden haben, und nicht eine einzelne Schrittfunktion.
Während dieser Schätzer gut zur Untersuchung der Form einer Verteilung geeignet ist, kann er etwas instabil sein, dh eine hohe Varianz in den Schätzungen. Man kann standardmäßige parametrische Modelle anpassen, es wird jedoch weiterhin empfohlen, die NPMLE zumindest für die Modellprüfung zu verwenden.
Viele der Standard-Überlebensregressionsmodelle sind verfügbar (z. B. proportionale Gefahren, beschleunigte Ausfallzeit und proportionale Quoten). Obwohl die NPMLE eine hohe Varianz für die Schätzungen der Überlebenskurve aufweist, leiden interessanterweise die Regressionsparameter in einem semiparametrischen Modell, das die NPMLE für die Basisverteilung verwendet, nicht unter der Instabilität. Daher sind semiparametrische Regressionsmethoden für Inferenzen sehr beliebt.
@Scortchi und @whuber sprechen wichtige Punkte zur Erzeugung des Beginns und des Endes der Beobachtungsintervalle an ( wie vom OP definiert). Eine vereinfachende Standardannahme (die sorgfältig werden sollte) ist, dass es eine Reihe von Inspektionszeiten gibt, die unabhängig von der tatsächlichen Ereigniszeit / dem tatsächlichen Ergebnis von Interesse (Gleichheit) erzeugt werden tritt auf, wenn wir die Ereigniszeit genau beobachten). Dann beobachten wir nur das Intervall so dassxs t a r tich,xe n dichC.0≤C.1≤ , . . . , ≤C.ktC.j,C.j + 1t ∈C.j,C.j + 1. Wenn es jedoch plausibel erscheint, dass die Ereigniszeit die Inspektionszeit stark beeinflussen könnte, muss bei der Analyse sorgfältig vorgegangen werden. Nehmen wir zum Beispiel an, unser Ereignis von Interesse war der Beginn von Karies und unsere Inspektionen waren Zahnarztbesuche. Wenn wir ziemlich regelmäßig zum Zahnarzt gehen, erscheint die Annahme der Unabhängigkeit vernünftig. Aber wenn wir sehr selten zum Zahnarzt gehen, außer wenn unser Zahn sehr weh tut, dann beeinflusst definitiv !tC.j
Ein kurzes Tutorial zur Verwendung dieser Modelle in meinem R-Paket icenReg
finden Sie hier .