Frage: Nehmen wir an, ich bin bereit, Ihnen mit einer 10-dimensionalen MCMC-Kette eine Matrix der Zeichnungen zu übergeben: 100.000 Iterationen (Zeilen) mit 10 Parametern (Spalten). Wie kann ich die posterioren Modi am besten identifizieren? Ich beschäftige mich besonders mit mehreren Modi.
Hintergrund:Ich betrachte mich als einen rechnerisch versierten Statistiker, aber als mir ein Kollege diese Frage stellte, schämte ich mich, dass ich keine vernünftige Antwort finden konnte. Das Hauptanliegen ist, dass mehrere Modi angezeigt werden können, jedoch nur, wenn mindestens acht der zehn Dimensionen berücksichtigt werden. Mein erster Gedanke wäre, eine Schätzung der Kerneldichte zu verwenden, aber eine Suche in R ergab nichts, was für Probleme mit mehr als drei Dimensionen vielversprechend wäre. Der Kollege hat eine Ad-hoc-Binning-Strategie in zehn Dimensionen vorgeschlagen und nach einem Maximum gesucht. Ich befürchte jedoch, dass die Bandbreite entweder zu erheblichen Sparsity-Problemen oder zu einer mangelnden Auflösung bei der Erkennung mehrerer Modi führen kann. Trotzdem würde ich gerne Vorschläge für automatisierte Bandbreitenvorschläge, Links zu einem 10-Kernel-Dichteschätzer oder alles andere, was Sie wissen, annehmen.
Sorgen:
Wir glauben, dass die Verteilung ziemlich verzerrt sein kann; Daher möchten wir die posterioren Modi und nicht die posterioren Mittel identifizieren.
Wir sind besorgt, dass es mehrere hintere Modi geben könnte.
Wenn möglich, würden wir einen R-basierten Vorschlag bevorzugen. Aber jeder Algorithmus wird funktionieren, solange es nicht unglaublich schwierig ist, ihn zu implementieren. Ich denke, ich würde es vorziehen, keinen Nd-Kernel-Dichteschätzer mit automatisierter Bandbreitenauswahl von Grund auf neu zu implementieren.