Welche gängigen Möglichkeiten zur Visualisierung von 4-dimensionalen Daten gibt es?


12

Angenommen, ich habe die folgenden vier dimensionalen Daten, wobei die ersten drei als Koordinaten und die letzte als Werte betrachtet werden können.

c1, c2, c3, value
1, 2, 6, 0.456
34, 34, 12 0.27
12, 1, 66 0.95

Wie lässt sich der Effekt der ersten drei Koordinaten auf den letzten Wert besser visualisieren?

Ich kenne drei Methoden.

Eine ist 3D-Plot für die ersten drei Koordinaten mit der Größe der Punkte als den vier Wert. Es ist jedoch nicht so einfach, den Trend in den Daten zu erkennen.

Zum anderen wird eine Reihe von 3D-Diagrammen verwendet, für die jeweils eine Koordinate festgelegt ist. Bildbeschreibung hier eingeben

Ein anderes kann ein sogenanntes "Gittergraph" im Gitter von R sein. Nicht sicher, ob es für diesen Zweck ist, aber es scheint so. Bildbeschreibung hier eingeben


2
Benötigen Sie ein statisches Display (zB für ein Papier)?
gung - Wiedereinsetzung von Monica

Antworten:


12

Wenn die ersten drei nur räumliche Koordinaten sind und die Daten dünn sind, können Sie einfach ein 3D-Streudiagramm mit unterschiedlich großen oder farbigen Punkten für den Wert erstellen.

Sieht ungefähr so aus: (Quelle: gatech.edu )Streuen

Wenn Ihre Daten in der Natur kontinuierlich sein sollen und sich in einem Gitter befinden, können Sie mit Marching Cubes mehrere Isokonturen der Daten zeichnen .

Ein anderer Ansatz, wenn Sie dichte 4D-Daten haben, besteht darin, mehrere 2D- "Schnitte" der in 3D eingebetteten Daten anzuzeigen. Es wird ungefähr so ​​aussehen:

Scheiben


Das farbige 3D-Streudiagramm eignet sich nur für kontinuierliche Funktionen auf 3D-Daten. Wenn sich der Verlauf der Funktion gleichmäßig ändert, sehen Sie ein Muster über der Punktstreuung. In ähnlicher Weise funktioniert die Volumenvisualisierung unten auch in diesem Szenario am besten. Wenn die Funktion sehr laut ist, fällt es Ihnen schwer, etwas zu sehen. Wenn Sie 4 erklärende Variablen haben (wie zum Beispiel für PCA oder Clustering), zeichnen Sie 3 in euklidischen Koordinaten und die 4. mit einer nichtlinearen Abbildung, um eine Wahrnehmungsverzerrung einzuführen, die nicht quantifiziert werden kann.
Dianne Cook

@ DianneCook das stimmt. Ich denke, das ist es, was ich bekomme, um immer mit reibungslosen, kontinuierlichen 3D-Volumendaten zu arbeiten;)
mklingen

Hey, das hat die Frage gestellt% ^)
Dianne Cook

9

Haben Sie vier quantitative Variablen? Wenn ja, versuchen Sie es mit Touren, parallelen Koordinatendiagrammen und Streudiagramm-Matrizen. Mit dem Paket tourr (und tourrGui) in R werden Touren ausgeführt, die sich im Grunde genommen in großen Dimensionen drehen. Sie können wählen, ob Sie in 1D, 2D oder mehr projizieren möchten, und es gibt ein JSS-Dokument, das Sie lesen können, um mit dem Zitieren des Pakets zu beginnen. Parallele Koordinatendiagramme und Streudiagramm-Matrizen sind im Paket GGally enthalten, ebenso Streudiagramm-Matrizen im Paket YaleToolkit. Unter http://www.ggobi.org finden Sie auch Videos und weitere Dokumentationen zu all diesen Themen.

Wenn Ihre Daten vollständig kategorisiert sind, sollten Sie Mosaikdiagramme oder Varianten verwenden. Schauen Sie sich das productplots-Paket in R an, auch vcd hat einige sinnvolle Funktionen, oder das ggparallel-Paket, um das Äquivalent von parallelen Koordinatendiagrammen für kategoriale Daten zu erstellen. Außerdem hat das extracat-Paket einige Funktionen zum Anzeigen kategorialer Daten.

Ich habe die Frage ursprünglich falsch verstanden, weil ich bei der Frage stehen geblieben bin und es versäumt habe, die vollständige Beschreibung zu lesen. Ähnlich wie im folgenden Ansatz (Einfärben von Punkten in 3D) können Sie mithilfe des verknüpften Pinsels Funktionen untersuchen, die in hochdimensionalen Räumen definiert sind. Schauen Sie sich hier das Video an , das dies für eine multivariate 3D-Normalfunktion zeigt. Der Pinsel malt Punkte mit hoher Dichte (hohe Funktionswerte) und bewegt sich dann zu niedrigeren und niedrigeren Dichtewerten (niedrige Funktionswerte). Die Orte, an denen die Funktion abgetastet wird, werden in einem rotierenden 3D-Streudiagramm unter Verwendung der Tour angezeigt, mit dem auch Domänen mit 4, 5 oder mehr Dimensionen betrachtet werden können.


2

Versuchen Sie es mit Chernoff-Gesichtern . Die Idee ist, die Variablen an die Gesichtsmerkmale anzuhängen. Zum Beispiel würde die Größe des Lächelns eine Variable sein, die Rundheit des Gesichts ist eine andere usw. So lächerlich es auch klingt, dies kann tatsächlich funktionieren, wenn Sie eine intelligente Methode zum Zuordnen von Variablen zu Features finden.

Eine andere Möglichkeit ist die Darstellung von 2D-Projektionen des 3D-Phasendiagramms. Angenommen, Sie haben x1, x2, x3, x4 Ihre Variablen. Zeichnen Sie für jeden Wert von x4 ein 3D-Diagramm mit (x1, x2, x3) Punkten und verbinden Sie die Punkte. Dies funktioniert am besten, wenn x4 bestellt wird, z. B. Datum oder Uhrzeit.

UPDATE: Sie können auch Bubble-Plots ausprobieren. Drei Dimensionen wären das übliche kartesische x, y, z, und die vierte Dimension wäre die Größe des Blasenpunktes.

Sie können die Animation ausprobieren, dh die Zeit als vierte Dimension verwenden.

Auch eine Kombination aus Blase und Animation: x, y, Blase und Zeit.

Mit Chernoff ist auch ein Glyphen-Plot verbunden , der etwas ernster aussehen kann. Es sind Sterne mit einer Strahlenlänge proportional zu variablen Werten.


Danke für die Antwort. Es scheint, dass die zweite Option zu meinem Problem möglich ist. Ich denke, die erste scheint für eine Forschungsarbeit nicht so ernst zu sein. Grundsätzlich möchte ich, dass die Darstellung einen Trend oder einen Einfluss von drei Faktoren auf den Wert (vierte Dimension) erkennen lässt.
Tyler 傲 傲 国 主

5
Chernoff-Gesichter wurden in ernsthaften Forschungen verwendet, afaik.
Aksakal,

1
Chernoff-Flächen können außerordentlich nützlich sein, insbesondere wenn die Dimensionalität etwa 10 bis 20 Variablen beträgt. Für vier Dimensionen sind sie nicht so effektiv wie andere Arten von grafischen Darstellungen.
Whuber

3
chernoff Gesichter sind eine schreckliche Idee! Wenn Sie einen Icon-Plot verwenden müssen, verwenden Sie einen Starplot. Wenn Sie einen wirklich kleinen Datensatz haben, sind diese möglicherweise nützlich. Zeichnen Sie jedoch 1000 Symbole und prüfen Sie, ob Sie wirklich etwas sehen können!
Dianne Cook
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.