Ich mag Gaussian Mixture Modelle (GMM's).
Eines ihrer Merkmale ist, dass sie im Probit-Bereich wie stückweise Interpolatoren wirken. Dies impliziert unter anderem, dass sie als Ersatzbasis fungieren können, als universeller Approximator. Dies bedeutet, dass für nicht-gaußsche Verteilungen wie logarithmische, weibliche oder verrückte nicht-analytische Verteilungen, sofern einige Kriterien erfüllt sind, die GMM die Verteilung approximieren kann.
Wenn Sie also die Parameter der optimalen AICc- oder BIC-Approximation mit GMM kennen, können Sie diese auf kleinere Dimensionen projizieren. Sie können es drehen und die Hauptachsen der Komponenten des approximierenden GMM betrachten.
Die Folge wäre eine informative und visuell zugängliche Möglichkeit, die wichtigsten Teile höherdimensionaler Daten mithilfe unserer visuellen Wahrnehmung in 3D zu betrachten.
EDIT: (sicher, whuber)
Es gibt verschiedene Möglichkeiten, die Form zu betrachten.
- Sie können Trends in den Mitteln betrachten. Ein Lognormal wird durch eine Reihe von Gaußschen approximiert, deren Mittel sich mit der Zeit immer mehr annähern und deren Gewichte mit der Zeit kleiner werden. Die Summe entspricht ungefähr dem schwereren Schwanz. In n-Dimensionen würde eine Folge solcher Komponenten eine Keule bilden. Sie können auch die Abstände zwischen den Mitteln (in hohe Bemaßung konvertieren) und den Richtungskosinus zwischen ihnen verfolgen. Dies würde zu viel leichter zugänglichen Dimensionen führen.
- Sie können ein 3D-System erstellen, dessen Achsen das Gewicht, die Größe des Mittelwerts und die Größe der Varianz / Kovarianz sind. Wenn Sie eine sehr hohe Anzahl von Clustern haben, können Sie diese auf diese Weise im Vergleich zueinander anzeigen. Es ist eine wertvolle Möglichkeit, 50.000 Teile mit jeweils 2.000 Maßen in ein paar Wolken in einem 3D-Raum umzuwandeln. Ich kann die Prozesssteuerung in diesem Bereich ausführen, wenn ich möchte. Ich mag die Rekursion der Verwendung des Gaußschen Mischungsmodells, das auf der Steuerung von Komponenten des Gaußschen Mischungsmodells basiert, die an Teile-Parameter angepasst sind.
- In Bezug auf die Unordnung können Sie nach sehr geringem Gewicht oder nach Gewicht pro Kovarianz oder dergleichen wegwerfen.
- Sie können die GMM-Wolke in Bezug auf BIC, , Mahalanobis-Abstand zu Komponenten oder insgesamt, Wahrscheinlichkeit der Mitgliedschaft oder insgesamt darstellen. R2
- Man könnte es so sehen, als würden sich Blasen kreuzen . Der Ort gleicher Wahrscheinlichkeit (null Kullback-Leibler-Divergenz) existiert zwischen jedem Paar von GMM-Clustern. Wenn Sie diese Position verfolgen, können Sie nach der Wahrscheinlichkeit der Mitgliedschaft an dieser Position filtern. Sie erhalten Punkte für die Klassifizierungsgrenzen. Dies wird Ihnen helfen, "Einzelgänger" zu isolieren. Sie können die Anzahl solcher Grenzen über dem Schwellenwert pro Mitglied zählen und eine Liste der "Verbundenheit" pro Komponente abrufen. Sie können auch Winkel und Entfernungen zwischen Standorten anzeigen.
- Sie können den Raum unter Verwendung von Zufallszahlen aus den Gaußschen PDF-Dateien neu abtasten, dann eine Hauptkomponentenanalyse durchführen und die Eigenformen und die damit verbundenen Eigenwerte betrachten.
BEARBEITEN:
Was bedeutet Form? Sie sagen, Spezifität sei die Seele jeder guten Kommunikation.
Was meinst du mit "messen"?
Ideen, was es bedeuten kann:
- Augapfel Norm Sinn / Gefühl der allgemeinen Form. (extrem qualitative, visuelle Zugänglichkeit)
- Maß für die GD & T-Form (Koplanarität, Konzentrizität usw.) (äußerst quantitativ)
- etwas Numerisches (Eigenwerte, Kovarianzen, etc ...)
- eine nützliche Koordinate mit reduzierter Dimension (wie GMM-Parameter zu Dimensionen werden)
- ein reduziertes Geräuschsystem (irgendwie geglättet, dann präsentiert)
Bei den meisten "verschiedenen Möglichkeiten" handelt es sich um Variationen.