Angenommen, ich habe eine Antwortvariable , die vom ten Geschwister in der ten Familie gemessen wurde . Darüber hinaus sind einige Verhaltensdaten in der gleichen Zeit von jedem Probanden erhoben wurden. Ich versuche die Situation mit dem folgenden linearen Mixed-Effects-Modell zu analysieren:
wobei und α 1 der feste Schnittpunkt bzw. die Steigung sind, δ 1 i die zufällige Steigung ist und ε i j der Rest ist.
Die Annahmen für die Zufallseffekte und Residuum ε i j sind (vorausgesetzt, es gibt nur zwei Geschwister in jeder Familie).
wobei ein unbekannter Varianzparameter ist und die Varianz-Kovarianz-Struktur R eine 2 × 2 symmetrische Formmatrix ist
das modelliert die Korrelation zwischen den beiden Geschwistern.
Ist dies ein geeignetes Modell für eine solche Geschwisterstudie?
Die Daten sind etwas kompliziert. Unter den 50 Familien sind fast 90% zweieiige Zwillinge. Für die übrigen Familien
- zwei haben nur ein geschwister;
- zwei haben ein DZ-Paar plus ein Geschwister; und
- zwei haben ein DZ-Paar plus zwei zusätzliche Geschwister.
Ich glaube, dass
lme
das R-Paketnlme
problemlos mit (1) fehlenden oder unausgeglichenen Situationen umgehen kann. Mein Problem ist, wie ich mit (2) und (3) umgehen soll. Eine Möglichkeit, die ich mir vorstellen kann, besteht darin, jede dieser vier Familien in (2) und (3) in zwei zu unterteilen, sodass jede Unterfamilie ein oder zwei Geschwister haben würde, sodass das obige Modell weiterhin angewendet werden könnte. Ist das in Ordnung? Eine andere Möglichkeit wäre, die Daten von den zusätzlichen ein oder zwei Geschwistern in (2) und (3) einfach wegzuwerfen, was eine Verschwendung zu sein scheint. Irgendwelche besseren Ansätze?Es scheint,
lme
dass man die Werte in der Restvarianz-Kovarianz-Matrix R festlegen kann , zum Beispiel r 2 12 = 0,5. Ist es sinnvoll, die Korrelationsstruktur festzulegen, oder sollte ich sie einfach anhand der Daten schätzen?
lme