Ich habe mehrere hundert Messungen. Jetzt überlege ich mir, irgendeine Art von Software zu verwenden, um jede Maßnahme mit jeder Maßnahme in Beziehung zu setzen. Dies bedeutet, dass es Tausende von Korrelationen gibt. Darunter sollte (statistisch) eine hohe Korrelation bestehen, auch wenn die Daten vollständig zufällig sind (jede Messung hat nur etwa 100 Datenpunkte).
Wie kann ich die Informationen darüber, wie intensiv ich nach einer Korrelation gesucht habe, in eine Korrelation einbeziehen?
Ich bin in der Statistik nicht auf einem hohen Niveau, bitte nehmen Sie Kontakt mit mir auf.
R
auf diesem Computer benötigt 18 Sekunden, um 1000 Realisierungen der Nullpermutationsverteilung des maximalen Korrelationskoeffizienten für eine 300 x
correl <- function(x, k=1) { n <- dim(x)[2] * (dim(x)[2]-1) / 2; v <- cor(x); sort(v[lower.tri(v)])[(n-k+1):n] }; sim <- replicate(1000, correl(apply(x,2,sample)))