Ich habe ein Experiment, das Beobachtungen der Zeit bis zum Eintreten eines Ereignisses liefert. Einige grundlegende Eigenschaften sind das
- Wir zählen die Anzahl der Ereignisse, die zu einem bestimmten Zeitpunkt aufgetreten sind .
- Ereigniszeiten werden zwischen ,
- Einzelpersonen verlassen den Prozess nicht zwischen , eine Einzelperson erlebt das Ereignis entweder durch oder nicht, an welchem Punkt sie zensiert werden.t 1
- Ein großer Teil der Personen wird das Ereignis nicht bis , wenn wir das Experiment beenden, und
- Ich kann keine zugrunde liegenden parametrischen Zerfallsmodelle annehmen.
Es scheint eine natürliche Anwendung für die Überlebensanalyse zu sein. Es wird jedoch durch die Tatsache kompliziert, dass es trivial ist, das Experiment aus derselben Anfangskonfiguration mehrmals zu wiederholen. Tatsächlich haben wir für jede Beobachtungszeit eine Menge von Ereigniszählungen (wobei die Anzahl der Abtastwerte ist) . Ich bin relativ neu in der Statistik und habe Schwierigkeiten zu sehen, wie man eine Überlebensanalyse auf diese Daten anwendet (wenn sie überhaupt anwendbar ist und es keine geeigneteren Methoden gibt, um diese Art von Zeit-zu-Ereignis-Daten zu messen). Meine Neigung ist es, die Überlebensfunktion um die mittlere Anzahl beobachteter Ereignisse in jedem Intervall zu konstruieren (dh s t i ˉ m 1 , . . . , n), die die erwartete Anzahl von Ereignissen in jedem Intervall in der Bevölkerung besser approximieren sollte, aber ich habe keine Ahnung, ob dies angemessen ist oder welche Auswirkungen dies hat.
Ich habe vergeblich in Google Scholar gesucht. Wenn mich jemand auf mehr Material verweisen könnte (oder mir die richtige Nomenklatur für das geben könnte, was ich versuche), wäre ich dankbar.
Bearbeiten
Angesichts der Tatsache, dass die -Intervalle über alle Stichproben hinweg einheitlich sind, sagen wir, dass ich die folgende Matrix hatte, die die kumulative Anzahl von Personen beschreibt, für die in jedem Intervall ein Ereignis aufgetreten ist
Dabei gibt jede Zeile die Ereignisanzahl für dieselbe Gruppe von Risikopersonen bei über alle Stichproben (dh mehrere Instanzen des Experiments) an, und jede Spalte ist ein Beobachtungsintervall. Ich gehe davon aus, dass ich durch die mittlere Anzahl von Ereignissen für jedes Intervall eine bessere Schätzung des erwarteten Überlebens der Population erhalten kann. bezeichne also die Anzahl der Zeitintervalle, die Anzahl der Proben (Versuchsinstanzen) und dann den Vektorn s
ist die mittlere Anzahl der beobachteten Ereignisse für jedes Zeitintervall.
Mein Ziel ist es daher, dies als Input für die Überlebensschätzung zu verwenden. Sei die Anzahl der gefährdeten Personen, wenn . Unter Verwendung des naiven Schätzers ( vorerst, da die Ereignisintervalle über alle Stichproben hinweg einheitlich sind und es bis keine Zensur gibt ) könnte die Überlebensfunktion wie folgt geschätzt werden:t = 0 t n
Dies wäre (hoffentlich) eine bessere Schätzung des Überlebens der Bevölkerung als jede einzelne Stichprobe (eine einzelne Zeile von ). Um meine Frage neu zu formulieren:
- Ist eine geeignete Eingabe für eine Überlebensfunktionsschätzung? Ich habe diesen Ansatz in keinem der Materialien gesehen, die ich gelesen habe.
- Kann mich jemand auf ein Material (akademische Arbeiten, Lehrbücher, Wikis usw. wären in Ordnung) zur Schätzung des Konfidenzintervalls und der Varianz für diese Überlebensfunktionsschätzung verweisen, da ich wirklich ein schmerzlicher Anfänger in der Statistik bin? Ich gehe davon aus, dass es nicht mit Standardformulierungen identisch sein wird.
Entschuldigung, wenn meine ursprüngliche Frage verwirrend war, habe ich wahrscheinlich nicht genügend Informationen hinzugefügt.