In diesem Beitrag können Sie die Erklärung lesen:
Modelle werden normalerweise durch Punkte auf einer endlich dimensionalen Mannigfaltigkeit dargestellt.
Über Differentialgeometrie und Statistik von Michael K. Murray und John W. Rice werden diese Konzepte in lesbarer Prosa erklärt, wobei die mathematischen Ausdrücke ignoriert werden. Leider gibt es nur sehr wenige Abbildungen. Gleiches gilt für diesen Beitrag auf MathOverflow.
Ich möchte um Hilfe bei einer visuellen Darstellung bitten, die als Karte oder Motivation für ein formelleres Verständnis des Themas dient.
Was sind die Punkte auf dem Verteiler? Dieses Zitat aus diesem Online-Fund weist anscheinend darauf hin, dass es sich entweder um die Datenpunkte oder um die Verteilungsparameter handeln kann:
Statistiken zu Mannigfaltigkeiten und Informationsgeometrie sind zwei verschiedene Arten, wie Differentialgeometrie auf Statistiken trifft. Während in der Statistik über Mannigfaltigkeiten die Daten auf einer Mannigfaltigkeit liegen, sind die Daten in der Informationsgeometrie in , aber die parametrisierte Familie der interessierenden Wahrscheinlichkeitsdichtefunktionen wird als Mannigfaltigkeit behandelt. Solche Verteiler sind als statistische Verteiler bekannt.
Ich habe dieses Diagramm gezeichnet, das von dieser Erklärung des Tangentenraums hier inspiriert ist :
[ Bearbeiten, um den folgenden Kommentar zu : ] Auf einer Mannigfaltigkeit ist der Tangentenraum die Menge aller möglichen Ableitungen ("Geschwindigkeiten") an einem Punkt , der mit assoziiert ist jede mögliche Kurve auf dem Verteiler verläuft durchDies kann als ein Satz von Karten von jeder Kurve gesehen werden, die sich durch kreuzt dh definiert als die Zusammensetzung , wobei eine Kurve bezeichnet (Funktion von der realen Linie bis zur Oberfläche des Verteilersp∈ M (ψ: R → M )p. p, C ∞ (t)→ R , ( f ∘ ψ ) ' (t)ψ M p,f,fp) durch den Punkt laufen und im obigen Diagramm rot dargestellt sind; und eine Testfunktion darstellen. Die „Iso- “ weißen Konturlinien auf demselben Punkt auf der durchgezogenen Linie und umgeben den Punkt .
Die Äquivalenz (oder eine der auf die Statistik angewendeten Äquivalenzen) wird hier erörtert und würde sich auf das folgende Zitat beziehen :
Wenn der Parameterraum für eine Exponentialfamilie eine dimensionale offene Menge enthält, wird er als voller Rang bezeichnet.
Eine Exponentialfamilie, die nicht den vollen Rang hat, wird im Allgemeinen als gekrümmte Exponentialfamilie bezeichnet, da der Parameterraum typischerweise eine Kurve in einer Dimension von weniger als s.
Dies scheint die Interpretation des Diagramms wie folgt zu machen: Die Verteilungsparameter (in diesem Fall der Familien der Exponentialverteilungen) liegen auf der Mannigfaltigkeit. Die Datenpunkte in würden im Fall eines nichtlinearen Optimierungsproblems mit Rangmangel durch die Funktion einer Linie auf dem Verteiler zugeordnet . Dies würde parallel zur Berechnung der Geschwindigkeit in der Physik erfolgen: Suche nach der Ableitung der Funktion entlang des Gradienten der "Iso-f" -Linien (Richtungsableitung in Orange):Die Funktion würde die Rolle der Optimierung der Auswahl eines Verteilungsparameters als Kurve ψ : R → M f ( f ∘ ψ ) ' ( t ) . f : M → R ψ fbewegt sich entlang der Konturlinien von auf dem Verteiler.
HINTERGRUND HINZUGEFÜGTES PERSONAL:
Bemerkenswerterweise glaube ich, dass diese Konzepte nicht unmittelbar mit der Verringerung der nichtlinearen Dimensionalität in ML zusammenhängen. Sie ähneln eher der Informationsgeometrie . Hier ist ein Zitat:
Wichtig ist, dass sich die Statistik über Mannigfaltigkeiten stark vom Lernen mit Mannigfaltigkeiten unterscheidet. Letzteres ist ein Zweig des maschinellen Lernens, bei dem das Ziel darin besteht, eine latente Mannigfaltigkeit aus bewerteten Daten zu lernen . Typischerweise ist die Abmessung des gesuchten latenten Verteilers kleiner als . Der latente Verteiler kann je nach verwendetem Verfahren linear oder nichtlinear sein. n
Die folgenden Informationen aus der Statistik über Verteiler mit Anwendungen zur Modellierung von Formverformungen von Oren Freifeld :
Während normalerweise nichtlinear ist, können wir jedem Punkt einen mit bezeichneten Tangentenraum zuordnen . ist ein Vektorraum, dessen Dimension der von . Der Ursprung von liegt bei . Wenn in einen euklidischen Raum eingebettet ist, können wir uns als einen affinen Unterraum so dass: 1) es bei berührt ; 2) Zumindest lokal liegt vollständig auf einer Seite davon. Elemente von TpM werden Tangentenvektoren genannt.T p M p ∈ M T p M M T p M p M T p M M p M.
[...] Auf Mannigfaltigkeiten werden statistische Modelle häufig in Tangentenräumen ausgedrückt.
[...]
[Wir betrachten zwei] Datensätze bestehen aus Punkten in :
;
Let und repräsentieren zwei, möglicherweise unbekannt, Punkte in . Es wird angenommen, dass die beiden Datensätze die folgenden statistischen Regeln erfüllen:µ S M.
[...]
Mit anderen Worten, wenn (als Tangentenvektoren) im Tangentenraum (zu ) bei , kann es als eine Menge von iid-Abtastwerten aus einem Gaußschen Mittelwert mit Kovarianz . Wenn im Tangentenraum bei , kann dies ebenfalls als eine Menge von iid-Abtastwerten aus einem Gaußschen Mittelwert mit Kovarianz . Dies verallgemeinert den euklidischen Fall. M μ L Σ L D S μ S Σ S.
Unter derselben Referenz finde ich online das nächste (und praktisch einzige) Beispiel für dieses grafische Konzept, nach dem ich frage:
Würde dies darauf hinweisen, dass Daten auf der Oberfläche des Verteilers liegen, ausgedrückt als Tangentenvektoren, und Parameter auf einer kartesischen Ebene abgebildet würden?