Was ist der Unterschied zwischen DP und CRP?
Der Chinese Restaurant Process (CRP) ist eine Verteilung auf Partitionen von ganzen Zahlen . Die Verbindung zum Dirichlet-Prozess (DP) besteht dank des Satzes von De Finetti.
De Finettis Theorem: Angenommen, wir haben einen zufälligen Prozess , der unendlich austauschbar ist , dann hat die gemeinsame Wahrscheinlichkeit eine Darstellung als Mischung:p ( θ 1 , … , θ N )( θ1, … , ΘN.)p ( θ1, … , ΘN.)
p ( θ1, … , ΘN.) = ∫dP.( G ) ∏i = 1N.G ( θich)
für einige Zufallsvariable .G
Die Austauschbarkeitseigenschaft bedeutet, dass wir uns weder um die Indizes der Tabellen kümmern (wir benennen die Tabellen nicht), noch um die Reihenfolge der Kunden an einem bestimmten Tisch. Die Aufteilung von Kunden in verschiedene Gruppen ist die einzige Struktur, an der wir interessiert sind. Dies bedeutet, dass wir bei einer Aufteilung nicht die bestimmten Zuordnungen von Kunden zu den Tabellen kennen müssen, sondern nur die Anzahl der Kunden an jeder Tabelle.
Der Satz von De Finetti hilft nicht, die Verteilung . Es heißt nur, dass es existieren sollte.G
Der Dirichlet-Prozess ist ein Vorrang vor Verteilungen . Informell haben Sie eine Wahrscheinlichkeitsverteilung eingegeben, und wenn Sie eine Stichprobe daraus erstellen, erhalten Sie eine Wahrscheinlichkeitsverteilung nach der Wahrscheinlichkeitsverteilung.
Die Verbindung zwischen beiden kann hergestellt werden, indem bewiesen wird, dass, wenn aus einem Dirichlet-Prozess abgetastet wird, die Gleichung in De Finettis Theorem für dieses bestimmte .G.GG
Wenn
G ∼ D P.( α , H.)
dann
p({θ(z=0)0,…,θ(z=0)n0},…,{θ(z=k)0,…,θ(z=k)nk})=αkΓ(α)Γ(α+n)∏i=0kΓ(ni)
Beachten Sie, dass durch ein CRP durch Wahrscheinlichkeiten für bestimmte Partitionen beschrieben wird. Hier bezeichnet einen Tabellenindex . Und ist die Anzahl der Kunden an Tabelle . Denken Sie der Vollständigkeit halber daran, dass der :p(θ1,…,θN)z=iiniiDP
{G(A1),…,G(Ak)}∼Dirichlet(αH(A1),…,αH(Ak))
Ich denke, dass aus dieser Darstellung klar hervorgeht, dass die Verbindung besteht, aber nicht als trivial angesehen werden sollte. Beachten Sie auch, dass ich das CRP nicht im Sinne einer bedingten Verteilung auf eingehende Einzelkunden beschrieben habe. Dies würde einen weiteren konzeptionellen Schritt zwischen CRP und DP hinzufügen. Mein Rat: Fühlen Sie sich frei, wenn Sie sich unwohl fühlen, wenn Sie ihre Beziehung direkt verstehen, und beginnen Sie damit, gemeinsame und marginale Verteilungen zu beschreiben, bis Sie die Verbindung reproduzieren. Das CRP wird durch Marginalisieren von aus dem DP erhalten.G
Zum Zusammenhang zwischen der gemeinsamen Wahrscheinlichkeit und der sequentiellen Beschreibung des CRP siehe [1].
Was ist, wenn die Austauschbarkeit nicht gilt?
Wenn die Austauschbarkeit nicht gewährleistet ist, sprechen wir nicht mehr über die DP oder die CRP, sondern über den Dependent Dirichlet-Prozess und den Dependent Chinese Restaurant-Prozess. Und natürlich geht die Verbindung zwischen ihnen verloren!
Siehe [2] für Details. Das abhängige CRP beschreibt, welcher Kunde mit welchem (einzelnen) anderen Kunden zusammensitzen möchte. Durch Clustering aller Kunden-Kunden-Beziehungen können wir eine Zuordnung über Tabellen vornehmen. Das abhängige CRP ist nicht unwesentlich: Die Wahrscheinlichkeit einer Partition beim Entfernen eines Kunden hängt auch von diesem Kunden ab. Im Gegensatz dazu wird der abhängige DP häufig durch diesen sehr marginalen definiert: . Hier ist zum Beispiel eine Dirichlet-Verteilung selbst oder eine beliebige Verteilung, die bewirkt, dass und in Beziehung stehen.H G t G t 'Gt∼DP(α,H)HGtGt′
Es sind viele andere Verallgemeinerungen möglich, von denen einige eine Darstellung über Partitionen sowie über Verteilungen zulassen, wie beispielsweise den chinesischen Restaurantprozess mit zwei Parametern mit dem Pitman-Yor-Prozess oder den indischen Buffet-Prozess mit dem Beta-Prozess [3]. . Einige von ihnen werden nicht.
- [1] : Ein Tutorial zu Bayes'schen nichtparametrischen Modellen (2011) Gershman und Blei
- [2] : Entfernungsabhängige chinesische Restaurantprozesse (2011) Blei und Frazier
- [3] : Hierarchische Beta-Prozesse und der indische Buffet-Prozess (2007) Thibaux und Jordanien