Zeitlinienanalyse


10

Ich untersuche die Beziehung zwischen der Geburtsordnung einer Person und dem späteren Risiko von Fettleibigkeit anhand von Daten aus mehreren 1-Jahres-Geburtskohorten (z . B. http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2908417/ ).

Eine zentrale Herausforderung besteht darin, dass die Reihenfolge der Geburt mit anderen Merkmalen wie dem Alter der Mutter, der Anzahl der jüngeren und / oder älteren Geschwister und dem Geburtsabstand verknüpft ist, die das Ergebnis auch über verschiedene Mechanismen beeinflussen können. Ferner könnte jeder Einfluss dieser Dinge auf das spätere Adipositasrisiko durch die Geschlechtszusammensetzung der Geschwister, einschließlich des "Indexkindes" (des Teilnehmers an der Geburtskohorte), verändert werden.

Für jedes Indexkind könnte man eine Zeitleiste zeichnen, die alle Geburten in der Familie zeigt, wobei das Alter der Mutter zum Zeitpunkt variabel ist.

Geben Sie hier die Bildbeschreibung ein

Ich versuche, Methoden zur Analyse dieser Art von Daten zu identifizieren, bei denen die Reihenfolge, der Zeitpunkt und die Art der Ereignisse wichtig sein könnten. Ich stelle diese Frage hier aufgrund der Vielfalt der Anwendungen, mit denen Mitglieder arbeiten. Ich gehe davon aus, dass jemand einige unmittelbare Vorschläge hat, für deren Identifizierung ich viel länger brauche. Alle Stöße in die richtige (n) Richtung (en) wären sehr dankbar.

Verwandte Frage (n): Wie soll ich Daten zu Geburtsintervallen von Frauen analysieren?


1
+1. Die übliche Frage: Haben Sie die Daten für den BMI der Eltern?
Deer Hunter

Ja, es gibt einige longitudinale anthropometrische Daten für die Mütter der Indexkinder. Leider nicht bei den Geschwistern, was jegliche zwischen und zwischen Familienanalysen ausschließt.
DL Dahly

Derzeit gibt es nicht viele hilfreiche Gedanken zum Thema Timeline. Möglicherweise möchten Sie das Alter der Mutter bei der ersten Geburt als eine weitere unabhängige Variable haben. Ich nehme an, Sie haben bereits explorative Analysen und Visualisierungen durchgeführt ...
Deer Hunter

Es ist klar, dass das Alter der Mutter wichtig ist, weshalb in den obigen Zeitplänen das Alter der Mutter als Zeitvariable verwendet wird. Ich denke, ich hoffe, eine alternative Methode zu finden, die mehr bietet, als nur alles in ein lineares Modell zu werfen.
DL Dahly

Ich bin mir nicht sicher, ob dies wichtig ist, aber ich würde denken, dass das Geburtsgewicht oder das durchschnittliche Geburtsgewicht der Kinder einer Frau eine interessante Kovariate sein könnte. Können Sie auch weitere Informationen zu Ihrem Ergebnis bereitstellen? Haben Sie wiederholte Maßnahmen?
ReliableResearch

Antworten:


2

Sie können die Verwendung von Mehrebenenmodellen (gemischte Regression) in Betracht ziehen, um die Auswirkungen zwischen und innerhalb der Familie abzuschätzen. Eine mögliche Strategie besteht darin, einen geplanten hierarchischen Modellbildungsansatz zu verwenden. Testen Sie beispielsweise jeden potenziellen Prädiktor in einem univariaten Modell. Wenn die Auswirkungen zwischen den Familien den Effekt der Geburtsreihenfolge beseitigen, würde dies stark darauf hindeuten, dass die Reihenfolge der Geburt nicht wichtig ist, sondern dass andere Einflüsse vorliegen. Ein Beispiel dafür für Auswirkungen der Geburtsordnung auf den IQ:

Ich hoffe das ist hilfreich.


+1 für eine gute Idee, auf die ich auch gestoßen bin, aber ich habe keine Ergebnisdaten zu Geschwistern für diese spezielle Analyse.
DL Dahly

0

Ich betrachte dies als statistische Frage und habe keine besonderen Kenntnisse über die medizinischen Fragen.

Wenn ich mir den Artikel ansehe, auf den Sie sich beziehen, sehe ich, dass eine Kohorte 970 Personen enthielt. Wenn Sie Daten zu mehreren Kohorten mit ungefähr dieser Größe haben, bietet die Gesamtgröße Ihres Datensatzes die Möglichkeit, relativ große Teilmengen auszuwählen, in denen die Zeitachse jedes Einzelnen bestimmte Bedingungen erfüllt. Beispielsweise könnte eine Untergruppe beispielsweise alle männlichen Personen im Alter von 25 bis 29 Jahren umfassen. Eine Regression eines geeigneten Maßes für die spätere Fettleibigkeit gegen die Geburtsordnung für eine solche Untergruppe würde jegliche mögliche Auswirkung von Geschlechtsunterschieden des Indexkindes auf die spätere Fettleibigkeit beseitigen und jede mögliche Auswirkung des mütterlichen Alters weitgehend beseitigen.

Es ist nicht einfach, diesen Ansatz auf das Geschlecht von Geschwistern auszudehnen, da eine Bedingung für eine Untergruppe beispielsweise wäre, dass das Indexkind ein älteres weibliches Geschwister hat, was impliziert, dass das Indexkind selbst kein ältestes Kind ist, was den Bereich einschränkt der unabhängigen Variablen in der Regression. Ein Weg, dies zu umgehen, könnte jedoch darin bestehen, Bedingungen mit "falls vorhanden" zu definieren. Zum Beispiel könnte eine Untergruppe definiert werden, die alle männlichen Personen im Alter von 25 bis 29 Jahren und mit älteren Geschwistern, falls vorhanden, alle weiblich umfasst. Eine solche Untergruppe würde immer noch Personen mit einer beliebigen Geburtsordnung umfassen.

Wenn eine Teilmenge durch eine zu komplexe Menge von Bedingungen definiert würde, wäre die Anzahl der darin enthaltenen Personen möglicherweise so gering, dass die resultierenden Schätzungen der Koeffizienten zu ungenau wären, um nützlich zu sein. Wenn dieser Ansatz gewählt würde, wäre bei der Definition von Teilmengen wahrscheinlich ein Kompromiss zwischen der Eliminierung möglichst vieler möglicher Effekte und der Einbeziehung genügend Personen erforderlich, um ein nützliches Ergebnis zu erzielen.


Danke für die Antwort Adam. In diesem Fall glaube ich jedoch nicht, dass eine Schichtung der Stichprobe etwas anderes aussagt als ein ähnlich angepasstes Modell. Es kann sehr gut sein, dass ein richtig spezifiziertes lineares Modell der beste Weg ist, dies zu tun ... Ich hatte nur gehofft zu sehen, ob Statistiker in anderen Bereichen ähnliche Probleme auf unterschiedliche Weise behandeln.
DL Dahly

Ich stimme zu - wenn Sie dies sagen -, dass mein Ansatz einer einzelnen Regression des gesamten Datensatzes unter Verwendung zahlreicher Indikatorvariablen entspricht. Am Beispiel des mütterlichen Alters besteht ein potenzielles Problem bei jedem Modell, das es als kontinuierliche Variable behandelt, darin, dass eine Annahme der funktionalen Form erforderlich ist (ein Zusammenhang zwischen dem Alter der Mutter und späterer Fettleibigkeit kann krummlinig sein). Im Gegensatz dazu benötigt ein Modell, das eine Reihe von Indikatorvariablen für Altersgruppen von Müttern verwendet, keine solche Annahme und ist in dieser Hinsicht allgemeiner.
Adam Bailey

0

Ich würde eine funktionale Datenanalyse vorschlagen, aber ich vermute, dass Sie viele Familien mit zu wenigen Kindern haben, um vernünftige Schätzungen zu erhalten. Lesen Sie es jedoch durch, da es Ihren Anforderungen entspricht. Vielleicht hat es schon jemand mit ähnlichen Daten verwendet.

Wenn Sie nicht so massiv nicht parametrisch vorgehen möchten, sollten Sie Ihr klinisches Fachwissen einsetzen, um die Dimensionalität der Daten zu verringern. Eine Variable in Ihrem Modell kann beispielsweise die Anzahl der Kinder sein, eine andere die durchschnittliche Anzahl der Jahre zwischen Kindern usw. Wenn diese Variablen Auswirkungen haben, werden sie möglicherweise auch dann angezeigt, wenn Sie die Funktionsform nicht sofort korrekt angegeben haben. Weitere wissensbasierte Modellbildung ermöglicht es Ihnen möglicherweise, ein hochgradig prädiktives Modell zu erstellen - stellen Sie einfach sicher, dass Sie einen Validierungssatz behalten!


Ich benutze die FDA und bin mir nicht sicher, wie es gilt. Ich könnte x-Achse = 0 für jedes Indexkind setzen und andere Geschwister zur +/- Zeit auf dieser Achse zeichnen lassen; und mütterliches Alter als y-Achse haben; und dann ein monotones funktionales Datenobjekt für jedes Indexkind schätzen ... aber sobald ich dies getan habe, habe ich alle Informationen über die tatsächliche Anzahl der Geschwister und wo sie entlang der Linie fallen verloren (weil jetzt alles von zusammengefasst ist die Funktion). Die FDA umfasst eine Reihe von Analysemodi - hatten Sie etwas Spezifischeres im Sinn?
DL Dahly
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.