Ich verwende derzeit einige lineare Modelle mit gemischten Effekten.
Ich benutze das Paket "lme4" in R.
Meine Modelle haben die Form:
model <- lmer(response ~ predictor1 + predictor2 + (1 | random effect))
Bevor ich meine Modelle ausführte, überprüfte ich die mögliche Multikollinearität zwischen Prädiktoren.
Ich habe das gemacht von:
Machen Sie einen Datenrahmen der Prädiktoren
dummy_df <- data.frame(predictor1, predictor2)
Verwenden Sie die "cor" -Funktion, um die Pearson-Korrelation zwischen Prädiktoren zu berechnen.
correl_dummy_df <- round(cor(dummy_df, use = "pair"), 2)
Wenn "correl_dummy_df" größer als 0,80 war, entschied ich, dass "predictor1" und "predictor2" zu stark korreliert waren und nicht in meinen Modellen enthalten waren.
Wenn Sie etwas lesen, scheint es objektivere Möglichkeiten zu geben, die Multikollinearität zu überprüfen.
Hat jemand einen Rat dazu?
Der "Variance Inflation Factor (VIF)" scheint eine gültige Methode zu sein.
VIF kann mit der Funktion "corvif" im AED-Paket (nicht Cran) berechnet werden. Das Paket finden Sie unter http://www.highstat.com/book2.htm . Das Paket unterstützt das folgende Buch:
Zuur, AF, Ieno, EN, N. Walker, Saveliev, AA & Smith, GM 2009. Modelle mit gemischten Effekten und Erweiterungen in Ökologie mit R, 1. Auflage. Springer, New York.
Es sieht so aus, als ob eine allgemeine Faustregel lautet: Wenn VIF> 5 ist, ist die Multikollinearität zwischen Prädiktoren hoch.
Ist die Verwendung von VIF robuster als die einfache Pearson-Korrelation?
Aktualisieren
Ich fand einen interessanten Blog unter:
http://hlplab.wordpress.com/2011/02/24/diagnosing-collinearity-in-lme4/
Der Blogger bietet nützlichen Code zur Berechnung des VIF für Modelle aus dem lme4-Paket.
Ich habe den Code getestet und es funktioniert großartig. In meiner nachfolgenden Analyse habe ich festgestellt, dass Multikollinearität für meine Modelle kein Problem darstellt (alle VIF-Werte <3). Dies war interessant, da ich zuvor eine hohe Pearson-Korrelation zwischen einigen Prädiktoren festgestellt hatte.
http://highstat.com/Books/BGS/GAMM/RCodeP2/HighstatLibV6.R
AED
Paket wurde eingestellt ; stattdessen nursource("http://www.highstat.com/Book2/HighstatLibV6.R")
für diecorvif
funktion. (2) Ich hoffe, eine echte Antwort zu liefern, aber (a) Ich glaube, dass VIF Multikollinearität berücksichtigt (z. B. haben Sie möglicherweise drei Prädiktoren, von denen keiner starke paarweise Korrelationen aufweist, aber die lineare Kombination von A und B ist stark mit C korreliert ) und (b) Ich habe starke Vorbehalte gegen die Weisheit, kollineare Terme fallen zu lassen. siehe Graham Ecology 2003, Doi: 10.1890 / 02-3114