Intraclass-Korrelationskoeffizient im gemischten Modell mit zufälligen Steigungen


10

Ich habe das folgende Modell , m_plotausgestattet mit lme4::lmermit gekreuzten zufälligen Effekten für die Teilnehmer ( lfdn) und Artikel ( content):

Random effects:
 Groups   Name             Variance Std.Dev. Corr                                     
 lfdn     (Intercept)      172.173  13.121                                            
          role1             62.351   7.896    0.03                                    
          inference1        24.640   4.964    0.08 -0.30                              
          inference2        52.366   7.236   -0.05  0.17 -0.83                        
          inference3        21.295   4.615   -0.03  0.22  0.86 -0.77                  
 content  (Intercept)       23.872   4.886                                            
          role1              2.497   1.580   -1.00                                    
          inference1        18.929   4.351    0.52 -0.52                              
          inference2        14.716   3.836   -0.16  0.16 -0.08                        
          inference3        17.782   4.217   -0.17  0.17  0.25 -0.79                  
          role1:inference1   9.041   3.007    0.10 -0.10 -0.10 -0.21  0.16            
          role1:inference2   5.968   2.443   -0.60  0.60 -0.11  0.78 -0.48 -0.50      
          role1:inference3   4.420   2.102    0.30 -0.30  0.05 -0.97  0.71  0.37 -0.90
 Residual                  553.987  23.537                                            
Number of obs: 3480, groups:  lfdn, 435 content, 20

Ich möchte die Intraclass Correlation Coefficients (ICC) für Teilnehmer und Elemente kennen. Dank dieser großartigen Antwort weiß ich im Prinzip, wie ich den ICC für mein Modell bekomme. Ich bin mir jedoch nicht sicher, ob ich die zufälligen Steigungen einbeziehen soll oder nicht:

vars <- lapply(summary(m_plot)$varcor, diag)
resid_var <- attr(summary(m_plot)$varcor, "sc")^2
total_var <- sum(sapply(vars, sum), resid_var)

# with random slopes
sapply(vars, sum)/total_var
##       lfdn    content 
## 0.33822396 0.09880349

# only random intercepts:
sapply(vars, function(x) x[1]) / total_var
##   lfdn.(Intercept) content.(Intercept) 
##         0.17496587          0.02425948 

Was ist das geeignete Maß für die Korrelation zwischen zwei Antworten desselben Teilnehmers auf denselben Punkt?


1
Merlo et al. 2005 "Ein kurzes konzeptionelles Tutorial zur Mehrebenenanalyse in der sozialen Epidemiologie: Untersuchung von Kontextphänomenen in verschiedenen Personengruppen" könnte eine nützliche Referenz sein.
N Brouwer

@ Henrik hast du jemals eine Antwort auf diese Frage gefunden? Ich bin auch interessiert.
Patrick S. Forscher

2
@ PatrickS.Forscher Soweit ich weiß, macht ICC bei zufälligen Steigungen keinen Sinn. Ich habe das von Jake Westfall gelernt.
Henrik

Haben Sie zufällig einen Link zu einer lesungsrelevanten Lesung?
Patrick S. Forscher

1
@ PatrickS.Forscher Wie Sie sehen können, hat Jake Westfall jetzt eine großartige Antwort gegeben.
Henrik

Antworten:


8

Grundsätzlich gibt es keine einzelne Zahl oder Schätzung, die den Grad der Clusterbildung in einem Modell mit zufälligen Steigungen zusammenfassen kann.

Die Intra-Class-Korrelation (ICC) kann nur als einfacher Anteil von Varianzen in Nur-Zufalls-Intercept-Modellen geschrieben werden. Um zu sehen , warum kann eine Skizze der Ableitung des ICC Ausdruck gefunden werden hier .

Wenn Sie zufällige Steigungen in die Modellgleichung einfügen, führt das Befolgen derselben Schritte stattdessen zum ICC-Ausdruck auf Seite 5 dieses Dokuments . Wie Sie sehen können, ist dieser komplizierte Ausdruck eine Funktion des Prädiktors X. Um intuitiver zu sehen, warum var (Y) bei zufälligen Steigungen von X abhängt, lesen Sie Seite 30 dieser Folien ("Warum hängt die Varianz von x ab?" ? ") .

Da der ICC eine Funktion der Prädiktoren (der x-Werte) ist, kann er nur für bestimmte Sätze von x-Werten berechnet werden. Sie könnten vielleicht versuchen, den ICC im gemeinsamen Durchschnitt der x-Werte anzugeben, aber diese Schätzung ist für die Mehrzahl der Beobachtungen nachweislich ungenau.

Alles, was ich gesagt habe, bezieht sich immer noch nur auf Fälle, in denen es einen einzigen Zufallsfaktor gibt. Mit mehreren Zufallsfaktoren wird es noch komplizierter. In einem Projekt mit mehreren Standorten, in dem die Teilnehmer an jedem Standort auf eine Stichprobe von Stimuli reagieren (dh 3 zufällige Faktoren: Standort, Teilnehmer, Stimulus), könnten wir beispielsweise nach vielen verschiedenen ICCs fragen: Welche Korrelation besteht zwischen zwei Antworten? am gleichen Ort, zum gleichen Reiz, von verschiedenen Teilnehmern? Wie wäre es an verschiedenen Orten, mit demselben Reiz und mit verschiedenen Teilnehmern? Und so weiter. @rvl erwähnt diese Komplikationen in der Antwort, mit der das OP verknüpft ist.

Wie Sie sehen können, ist der einzige Fall, in dem wir den Grad der Clusterbildung mit einem einzelnen Wert zusammenfassen können, der Fall nur mit einem zufälligen Zufallsfaktor. Da dies ein so geringer Anteil der Fälle in der Praxis ist, sind ICCs die meiste Zeit nicht so nützlich. Meine allgemeine Empfehlung ist es also, sich nicht einmal um sie zu sorgen. Stattdessen empfehle ich, nur die Varianzkomponenten zu melden (vorzugsweise in Standardabweichungsform).

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.