Ich lese gerade ein großartiges HMC-Einführungspapier von Prof. Michael Betancourt, aber ich verstehe nicht, wie wir die Verteilung des Impulses wählen sollen.
Zusammenfassung
Die Grundidee von HMC besteht darin, eine Impulsvariable in Verbindung mit der Zielvariablen einzuführen . Sie bilden gemeinsam einen Phasenraum .
Die Gesamtenergie eines konservativen Systems ist eine Konstante und das System sollte den Hamilton-Gleichungen folgen. Daher können die Trajektorien im Phasenraum in Energieniveaus zerlegt werden , jedes Niveau entspricht einem gegebenen Wert der Energie und kann als eine Menge von Punkten beschrieben werden, die erfüllt:
.
Wir möchten die gemeinsame Verteilung \ pi (q, p) schätzen , damit wir durch Integration von die gewünschte Zielverteilung . Darüber hinaus kann äquivalent als , wobei entspricht Ein bestimmter Wert der Energie und ist die Position auf diesem Energieniveau.
Für einen gegebenen Wert von ist relativ einfacher zu wissen, da wir die Hamilton-Gleichungen integrieren können, um die Datenpunkte auf der Trajektorie zu erhalten . Jedoch ist der schwierige Teil, der davon abhängt , wie wir den Impuls geben, die folglich die Gesamtenergie bestimmt .
Fragen
Es scheint mir, dass das , wonach wir , aber was wir praktisch schätzen können, ist , basierend auf der Annahme, dass kann ungefähr ähnlich zu , wie in Fig. 23 des Papiers dargestellt. Was wir jedoch tatsächlich abtasten, scheint .
Q1 : Ist das so, weil wir, sobald wir , leicht berechnen und daher ?
Um anzunehmen, dass gilt, verwenden wir einen verteilten Gaußschen Impuls. In dem Papier werden zwei Möglichkeiten erwähnt:
Dabei ist eine Konstante, die als euklidische Metriken bezeichnet wird, auch bekannt als Massenmatrix .
Im Fall der ersten Wahl (Euklidisch-Gauß) ist die Massenmatrix tatsächlich unabhängig von , so dass die Wahrscheinlichkeit, dass wir eine Stichprobe machen, tatsächlich . Die Wahl des Gauß-verteilten Impulses mit der Kovarianz impliziert, dass die Zielvariable mit der Kovarianzmatrix Gauß-verteilt ist , da und umgekehrt transformiert werden müssen, um das Volumen im Phasenraum konstant zu halten .
F2 : Meine Frage ist, wie können wir erwarten, dass einer Gaußschen Verteilung folgt? In der Praxis könnte eine komplizierte Verteilung sein.