Ich muss eine verallgemeinerte Gaußsche Verteilung an eine 7-dim-Punktwolke anpassen, die eine beträchtliche Anzahl von Ausreißern mit hoher Hebelwirkung enthält. Kennen Sie ein gutes R-Paket für diesen Job?
Ich muss eine verallgemeinerte Gaußsche Verteilung an eine 7-dim-Punktwolke anpassen, die eine beträchtliche Anzahl von Ausreißern mit hoher Hebelwirkung enthält. Kennen Sie ein gutes R-Paket für diesen Job?
Antworten:
Es gibt auch mclust: http://www.stat.washington.edu/research/reports/2012/tr597.pdf http://cran.r-project.org/web/packages/mclust/index.html
Eine Warnung: Die Modellierung von Gemischen im hochdimensionalen Raum kann sehr CPU- und speicherintensiv werden, wenn Ihre Punktwolke groß ist. Vor ungefähr vier Jahren habe ich einen Stapel von 11-dimensionalen 50-200K-Punktdaten erstellt, und es wurde tendenziell 4-11 GB RAM benötigt, und es dauerte bis zu einer Woche, um für jeden Fall zu berechnen (und ich hatte 400). Dies ist sicherlich möglich, kann jedoch Kopfschmerzen bereiten, wenn Sie einen gemeinsam genutzten Computercluster verwenden oder nur über begrenzte Ressourcen verfügen.
Dies klingt nach einem klassischen multivariaten Gaußschen Mischungsmodell. Ich denke, dass das BayesM-Paket funktionieren könnte.
Hier sind einige multivariate Gaußsche Mischungspakete