Schätzung der Variabilität über die Zeit

Ich habe einen Datensatz, der ~ 7.500 Blutuntersuchungen von ~ 2.500 Personen enthält. Ich versuche herauszufinden, ob die Variabilität der Blutuntersuchungen mit der Zeit zwischen zwei Tests zunimmt oder abnimmt. Zum Beispiel: Ich ziehe Ihr Blut für den Basistest und ziehe dann sofort eine zweite Probe. Sechs Monate später ziehe ich eine weitere Probe. Man könnte erwarten, dass der Unterschied zwischen dem Basislinien- und dem Sofortwiederholungstest geringer ist als der Unterschied zwischen dem Basislinien- und dem Sechsmonatstest.

Jeder Punkt auf dem Diagramm unten spiegelt den Unterschied zwischen zwei Tests wider. X ist die Anzahl der Tage zwischen zwei Tests; Y ist die Größe der Differenz zwischen den beiden Tests. Wie Sie sehen können, sind die Tests nicht gleichmäßig auf X verteilt - die Studie war eigentlich nicht darauf ausgelegt, diese Frage zu beantworten. Da die Punkte im Mittelwert so stark gestapelt sind, habe ich 95% (blau) und 99% (rot) Quantillinien eingefügt, basierend auf 28-Tage-Fenstern. Diese werden offensichtlich von den extremeren Punkten herumgezogen, aber Sie bekommen die Idee.

Alternativtext http://a.imageshack.us/img175/6595/diffsbydays.png

Mir scheint, dass die Variabilität ziemlich stabil ist. Wenn überhaupt, ist es höher, wenn der Test innerhalb kurzer Zeit wiederholt wird - das ist furchtbar intuitiv. Wie kann ich dies systematisch angehen und dabei zu jedem Zeitpunkt (und in einigen Zeiträumen ohne Tests) unterschiedliche n berücksichtigen? Ihre Ideen werden sehr geschätzt.

Nur als Referenz ist dies die Verteilung der Anzahl der Tage zwischen Test und erneutem Test:

Alternativtext http://a.imageshack.us/img697/6572/testsateachtimepoint.png

repeated-measures variability

— Matt Parker
quelle

+1 für interessanten realen Fall! Können Sie uns helfen zu verstehen, was eine Blutuntersuchung ist? (Wie berechnen Sie es)

— Robin Girard

Es gab einen Artikel über LFT (Leberfunktionstests) und wie es sich zyklisch (in Monaten) zu ändern schien. Ich denke, es war in Annals of Internal Medicine.

— Ming K

Sicher - kurz gesagt, es ist ein Test für latente Tuberkulose-Infektionen. Dem Patienten wird Blut in drei Röhrchen entnommen: eines ohne Antigene, eines mit ausgewählten TB-Antigenen und eines mit Mitogen. Wir vergleichen dann das Ausmaß der immunologischen Reaktion im Röhrchen ohne Antigene mit dem mit TB - wenn sie einen starken Reaktionsschub im TB-Röhrchen aufweisen, können sie latente TB aufweisen. (Das Mitogenröhrchen dient als Kontrolle, um sicherzustellen, dass die Person überhaupt in der Lage ist, eine immunologische Reaktion hervorzurufen - die meisten Menschen reagieren sehr stark darauf)

— Matt Parker

Aus Ihrer Beschreibung kann ich keinen Grund erkennen, den "Basistest" von der sofort gezogenen "zweiten Probe" zu unterscheiden. Es handelt sich lediglich um 2 Basislinienmessungen, und die Varianz (an der Basislinie) kann auf dieser Basis berechnet werden. Es wäre besser, den Mittelwert der beiden Grundlinienmessungen gegen die dritte "sechsmonatige" Stichprobe aufzutragen.

Das Problem ist mit der 6-Monats-Probe. Da zu diesem Zeitpunkt nur eine Stichprobe entnommen wird, gibt es keine Möglichkeit, die "Variabilität" an diesem Punkt abzuschätzen oder die Stichprobenvariation von der (realen) Längsänderung des TB-Messwerts zu trennen.

Wenn wir dies als ein Problem der Längsschnittdatenanalyse betrachten, würden wir wahrscheinlich einen zufälligen Schnittpunkt (Basis-TB) und eine zufällige Steigung (passend zum 6-Monats-TB) wählen. Die Variabilität der Stichproben würde aus den beiden Basislinienmessungen und der Steigung aus der dritten 6-Monats-Messung geschätzt. Wir können die Variabilität nicht auf 6 Monate schätzen, ohne starke Verteilungsannahmen für die Veränderung über diese sechs Monate, z. B. unter der Annahme, dass sich nichts ändert.

— Thylacoleo
quelle