Ich muss eine Art "Durchschnitt" aus einer Liste von Abweichungen ermitteln, habe aber Probleme, eine vernünftige Lösung zu finden. Es gibt eine interessante Diskussion über die Unterschiede zwischen den drei pythagoreischen Mitteln (arithmetisch, geometrisch und harmonisch) in diesem Thread ; Ich glaube jedoch immer noch nicht, dass einer von ihnen ein guter Kandidat wäre. Irgendwelche Vorschläge?
PS Ein gewisser Kontext - Diese Varianzen sind Stichprobenvarianzen von Probanden, von denen jeder denselben Versuchsaufbau mit ungefähr derselben Stichprobengröße durchlief . Mit anderen Worten, es gibt Stichprobenvarianzen , , ..., , die diesen Subjekten entsprechen. Auf Bevölkerungsebene wurde bereits eine Metaanalyse durchgeführt. Der Grund, warum ich eine Art "durchschnittliche" oder "zusammengefasste" Stichprobenvarianz erhalten muss, ist, dass ich damit einen Index wie ICC nach der Metaanalyse berechnen möchte .k n σ 2 1 σ 2 2 σ 2 n n
PPS Um die Diskussion konkreter zu halten, möchte ich das Problem anhand des folgenden Beispiels in R erläutern:
library(metafor)
dat <- get(data(dat.konstantopoulos2011))
dat$district <- as.factor(dat$district)
dat$school <- as.factor(dat$school)
Im Datensatz gibt es eine Varianz, die mit der Leistungsbewertung jeder Schule verknüpft ist:
str(dat)
Classes ‘escalc’ and 'data.frame': 56 obs. of 6 variables:
$ district: Factor w/ 11 levels "11","12","18",..: 1 1 1 1 2 2 2 2 3 3 ...
$ school : Factor w/ 11 levels "1","2","3","4",..: 1 2 3 4 1 2 3 4 1 2 ...
$ year : int 1976 1976 1976 1976 1989 1989 1989 1989 1994 1994 ...
$ yi : atomic -0.18 -0.22 0.23 -0.3 0.13 -0.26 0.19 0.32 0.45 0.38 ...
$ vi : num 0.118 0.118 0.144 0.144 0.014 0.014 0.015 0.024 0.023 0.043 ...
Angenommen, wir führen eine Metaanalyse mit einem hierarchischen Modell oder einem Modell mit gemischten Effekten durch:
Dabei sind und die zufälligen Effekte für die te Schule bzw. den ten Bezirk und der Messfehler mit einer bekannten Gaußschen Verteilung . Dieses Modell kann wie folgt analysiert werden:β j i j ϵ i j N ( 0 , v i j )
(fm <- rma.mv(yi, vi, random = list(~1 | district, ~1 | school), data=dat))
Rendern der folgenden Varianzschätzungen für die beiden Varianzkomponenten:
Multivariate Meta-Analysis Model (k = 56; method: REML)
Variance Components:
estim sqrt nlvls fixed factor
sigma^2.1 0.0814 0.2853 11 no district
sigma^2.2 0.0010 0.0308 11 no school
Die beiden Varianzen im Ergebnis, Sigma ^ 2.1 und Sigma ^ 2.2, entsprechen den beiden Variablen mit zufälligen Effekten (Bezirk und Schule).
Ich möchte den ICC für Distrikt berechnen, und deshalb wollte ich zunächst eine zusammengefasste Varianz für diese einzelnen Varianzen des . Da ist die Gesamtvarianz ϵ i j
Mein ursprünglicher (und einfacher) Ansatz bestand darin, nur das arithmetische Mittel zu verwenden:
Ich bin mir jedoch nicht sicher, ob das arithmetische Mittel in diesem Zusammenhang angemessen ist.