Eine mögliche Idee ist die Verwendung von Sankey-Diagrammen , um den Auswahlfluss zwischen den Kategorien zu dokumentieren. Zwei Beispiele, um zu beschreiben, wovon ich spreche, sind:
Mit einem Update über einige Ihrer Bedenken, die in den Kommentaren zum Ausdruck gebracht wurden. Es scheint mir, dass das Programm "Parallele Sätze" sofort das tut, was Sie wollen. Unten ist eine Ausgabe des Programms, in dem ich 4 Zufallsvariablen mit 4 Kategorien erstellt habe. Unabhängig davon, welche Gruppe Sie oben in der Anzeige initialisieren, wird sie nacheinander auf die nachfolgenden Kategorien aufgeteilt. Erstellen Sie die gewünschte Aufteilung.
Auch in diesem Bild nicht ersichtlich, verfügt das Paket über einige interaktive Funktionen, die eine einfachere explorative Datenanalyse ermöglichen, z. B. wenn Sie mit der Maus über eine der Kategorien fahren, werden alle Nachkommen hervorgehoben.
Ich habe denselben Datensatz auf Fineo hochgeladen, den Sie hier erkunden können . Neben den ersten 4 Kategorievariablen (benannt dec1
nach dec4
) habe ich auch die verketteten Kategorien aufgenommen, mit denen Sie die geteilten Kategorien untersuchen können. Die Namenskonvention für die Variablen mit dem exp
Suffix lautet, dass es sich um die dec
Variable handelt, die durch Verketten der zuvor ausgewählten Kategorien erweitert wurde. So dec3_exp12
würde markiert werden , 121
wenn dec1 = 1 and dec2 = 2 and dec3 = 1
. Sie können in Fineo dieselbe Split-Typ-Struktur erstellen, die in ParSets verfügbar ist, in diesem Beispiel können jedoch die Kategorien mit oder mehr Knoten nicht gerendert werden .43
Nach dem Herumspielen mit Fineo ist es eine nette Anwendung, aber es ist wirklich begrenzt. Parallele Sets bieten viel mehr Funktionen, daher würde ich empfehlen, dass Sie dies vor der Fineo-App überprüfen.
Ich denke, das ParSets-Programm ist eine viel bessere Option als die sukzessive Aufteilung der Kategorien in Teilmengen zur Prüfung. In einem Beispiel, in dem dieselben Zufallsdaten wie oben verwendet werden, ist hier ein Punktdiagramm dargestellt, in dem die Proportionskategorien in der decision 2
ausgewählten Bedingung abhängig von der ausgewählten Kategorie aufgetragen sind decision 1
.
Sie können dieselbe Aufschlüsselung für den Wechsel von decision 2
zu decision 3
vornehmen, jedoch ein kleines Mehrfachdiagramm für die Initiale decision 1
erstellen.
Sie können dies unendlich fortsetzen (siehe unten). Es mag aufschlussreich sein, aber ich vermute, es wäre ziemlich entmutigend, wenn Sie zu vielen weiteren Panels gelangen. Unten sehen Sie wie gewünscht 4 aufeinanderfolgende Kategorien.
Wie bereits erwähnt, sind die kleinen Zahlen zum Zeitpunkt der Aufteilung Ihrer Grafik in so viele Kategorien problematisch. Eine Möglichkeit, dies zu berücksichtigen, besteht darin, eine Ästhetik wie die Größe auf die Basislinie abzubilden, auf der der Anteil basiert. Dies verkleinert die Beobachtungen aufgrund kleinerer Zahlen aus der Sicht. Sie können auch Transparenz verwenden (aber ich habe die Punkte bereits transparent gemacht, um überzeichnete Punkte in diesem Beispiel zu unterscheiden).
Ich stelle mir vor, einige stellten sich eine weihnachtsbaumähnliche Knotenstruktur im Gegensatz zu Punktdiagrammen vor, aber ich weiß nicht, wie man eine solche Grafik erstellt. Ich vermute, es wäre das gleiche überwältigende Problem. Diese kleinen Vielfachen sind nicht schlecht, aber IMO the Parallel Sets ist viel intuitiver und ich vermute, dass einige nicht offensichtliche Muster in dieser Visualisierung offensichtlicher wären. Vielleicht kann jemand, der einfallsreicher ist als ich, interessantere Daten als nur 4 zufällige Kategorien liefern.