Auswahl der Pfadgewichte in SEM-Konzeptmodellen für eineiige und brüderliche Zwillinge mit openMx


10

Ich überprüfe das R-Paket OpenMx für eine genetische epidemiologische Analyse, um zu lernen, wie SEM-Modelle spezifiziert und angepasst werden. Ich bin neu in diesem Bereich, also nimm ihn mit. Ich folge dem Beispiel auf Seite 59 des OpenMx-Benutzerhandbuchs . Hier zeichnen sie folgendes konzeptionelles Modell:

SEM-Modelle für eineiige und brüderliche Zwillinge

Und bei der Angabe der Pfade setzen sie das Gewicht des latenten "Eins" -Knotens auf die manifestierten BMI-Knoten "T1" und "T2" auf 0,6, weil:

Die wichtigsten interessierenden Pfade sind diejenigen von jeder der latenten Variablen zur jeweiligen beobachteten Variablen. Diese werden ebenfalls geschätzt (somit werden alle freigegeben), erhalten einen Startwert von 0,6 und entsprechende Beschriftungen.

# path coefficients for twin 1
mxPath(
  from=c("A1","C1","E1"),
  to="bmi1",
  arrows=1,
  free=TRUE,
  values=0.6,
  label=c("a","c","e")
),

# path coefficients for twin 2
mxPath(
  from=c("A2","C2","E2"),
  to="bmi2",
  arrows=1,
  free=TRUE,
  values=0.6,
  label=c("a","c","e")
),

Der Wert von 0,6 kommt von der geschätzten Kovarianz bmi1und bmi2(streng mono zygotischen Zwillingspaar). Ich habe zwei Fragen:

  1. Wenn sie sagen, dass der Pfad einen "Start" -Wert von 0,6 erhält, ist dies wie das Einstellen einer numerischen Integrationsroutine mit Anfangswerten, wie bei der Schätzung von GLMs?

  2. Warum wird dieser Wert streng von den monozygoten Zwillingen geschätzt?

Antworten:


4

Um Ihre 2 Punkte zu beantworten:

1) Ja, genau - der Startwert bestimmt lediglich, wo der Algorithmus den Optimierungsprozess startet. Die meisten Softwarepakete bestimmen standardmäßig ihren eigenen Startwert, und der Benutzer muss nur dann versuchen, andere Werte einzugeben, wenn während der Schätzung Probleme auftreten. Nach meiner Erfahrung reichen die plausibelsten Startwerte aus und ändern nicht das endgültige Modell, auf dem der Algorithmus konvergiert.

2) Der Wert 0,6 ist der Startwert nicht für den Achsenabschnitt von T1 und T2 (Pfad zwischen "Eins" und T1 & T2), sondern der Startwert für die Faktorladungen, die jede latente Variable (A, C, E verbinden ) zu ihrem Indikator T1 oder T2. Dies wird durch die Tatsache angezeigt, dass der Pfad from=c("A1","C1","E1"), to="bmi1"im ersten Fall und from=c("A2","C2","E2"), to="bmi2"im zweiten Fall verläuft.

Was den spezifischen Wert "0,6" betrifft: Ich konnte in der Dokumentation nicht finden, wo sie erwähnen, dass dieser Wert basierend auf der Untergruppe der monozygoten Zwillinge genommen wird; und tatsächlich können diese Parameterschätzungen (Faktorladungen für die 3 latenten Variablen) nicht direkt aus der Stichprobe berechnet werden, da diese latenten Variablen per Definition nicht beobachtet werden (sie sind latent). Wie ich in Punkt 1 erwähne, wirkt sich die Wahl zwischen zwei plausiblen Werten selten auf die Parameterschätzungen des konvergierten Modells aus. Ich vermute daher, dass sie einfach einen von vielen plausiblen Werten für diese Faktorladungen als Ausgangswerte gewählt haben. Ob dieser Wert nur aus der geschätzten Kovarianz zwischen bmi1 und bmi2 in der Untergruppe der monozygoten Zwillinge stammt, sollte irrelevant sein, da plausible Startwerte dazu führen sollten, dass der Algorithmus auf dieselben Endwerte konvergiert. vielleicht mit einigen Unterschieden in der Rechenzeit. (Und mein Rat, um sich selbst zu überzeugen, lautet: Probieren Sie es aus! Probieren Sie mehrere Startwerte aus und vergleichen Sie die Parameterschätzungen der konvergierten Modelle.)

Als allgemeine Anmerkung möchte ich darauf hinweisen, dass die Auswahl der Startwerte für jede Parameterschätzung SEHR wichtig wird, wenn das Argument auf gesetzt freeist FALSE, da der Startwert effektiv zum Wert der Parameterschätzung im endgültigen Modell wird (dies wird nicht der Fall sein) geschätzt werden; es wird vor der Schätzung festgelegt).

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.