Ich untersuche Trends (zwischen 1998 und 2011) der Sterblichkeitsraten bei Patienten mit Morbus Crohn. Jeder Patient (Fall) wurde in den Jahren 1998 bis 2011 eingeschlossen. Bei der Aufnahme wurde jeder Patient einer gesunden Kontrolle mit demselben Alter und Geschlecht zugeordnet. Ich analysiere Trends bei den Sterblichkeitsraten. Wenn ich dies direkt und ohne Anpassungen mache, erhalte ich im Laufe der Zeit schwankende Sterblichkeitsraten, was vermutlich darauf zurückzuführen ist, dass Personen, die ein bestimmtes Jahr eingeschlossen haben, nicht mit denen vergleichbar sind, die ein anderes Jahr enthalten. Daher möchte ich die Sterblichkeitsraten anpassen. Ich gehe davon aus, dass die Sterblichkeitsraten in beiden Gruppen (Fälle und Kontrollen) im Laufe der Zeit sinken und sich die Kluft zwischen Fällen und Kontrollen sukzessive verringern wird.
Meine Idee ist es, die Anpassung mittels Poisson-Regression vorzunehmen. Meine Daten sind auf individueller Ebene. Ich möchte eine Schätzung der Inzidenzrate (pro 1000 Personenjahre) für Fälle und Kontrollen jedes Jahr von 1998 bis 2011 erhalten. Die Überlebenszeit würde als Offset in das Modell aufgenommen. Etwas Ähnliches ist geschehen hier .
Ich habe die 200 ersten Zeilen aus meinem Datensatz angehängt, der aus 1500 Personen besteht. Hier sind die Daten . Variable Erklärung:
- tot = ob der Patient während der Nachsorge gestorben ist oder nicht
- Überleben = Überlebenszeit in Tagen
- Altersgruppe = kategorisierte Altersgruppe (4 Gruppen)
- Geschlecht = männlich / weiblich
- Diagnose = 0 für gesunde Kontrolle, 1 für Morbus Crohn
- Alter = Alter in Jahren
- Einschlussjahr = Jahr der Aufnahme in die Studie
Was habe ich bisher versucht? Ich habe versucht, Poisson-Modelle mit der Funktion glm () in R unter Verwendung einzelner Beobachtungen (log (Surv) als Offset) anzupassen, aber ich habe entweder einen Fehler erhalten oder konnte nicht herausfinden, wie die Anpassungen verwendet werden sollen. Ich habe die Daten auch in Gruppen zusammengefasst und dann die Todeszahlen in glm () analysiert. Wenn ich die Anpassung verwendete, um Inzidenzraten zu erhalten, konnte ich nur Raten für ein bestimmtes Alter / eine bestimmte Altersgruppe und ein bestimmtes Geschlecht erhalten (wie in der Funktion "dict ()" angegeben).
Ich würde mich sehr über statistische Ratschläge und Codierungsbeispiele freuen, die für den angehängten Datensatz durchgeführt werden können.
contrasts<-
( *tmp*
, value = contr.funs [1 + isOF [nn]]): Kontraste können nur auf Faktoren mit 2 oder mehr Ebenen angewendet werden
diagnosis*inclusion_year
Interaktionstermen einbeziehen . Wenn Sie nur das aktuelle Modell verwenden, unterscheidet sich die Fallnummer nur durch die Beta von diagnosis
, die über Jahre konstant ist, da keine Interaktion zulässig ist. Danach werden die Vorhersagen nur noch Substitution sein. Ich bin nicht zu wählerisch, also würde ich nur das Durchschnittsalter und den mittleren Männeranteil unterschreiten.