Ich bin damit einverstanden, dass die "beste" Handlung nicht unabhängig von Datensatz, Leserschaft und Zweck existiert. Bei zwei gemessenen Variablen sind Streudiagramme wahrscheinlich das Design, bei dem alle anderen außer für bestimmte Zwecke im Nachhinein verbleiben. Für kategoriale Daten ist jedoch kein solcher Marktführer erkennbar.
Ich möchte hier nur eine einfache Methode erwähnen, die oft wiederentdeckt oder neu erfunden, aber auch oft übersehen wird, selbst in Monographien oder Lehrbüchern über statistische Grafiken.
Beispiel zuerst, mit denselben Daten wie von xan:
Wenn ein Name gewünscht wird, ist dies, wie so oft, ein Zwei-Wege-Balkendiagramm (in diesem Fall). Ich werde hier keine anderen Begriffe katalogisieren, außer dass mehrere Balkendiagramme eine häufige Alternative mit ähnlichem Geschmack sind. (Mein kleiner Einwand gegen "mehrere Balkendiagramme" ist, dass "mehrere" die sehr häufig gestapelten oder nebeneinander angeordneten Balkendiagramme nicht ausschließt, wohingegen "zwei" für mich klarer ein Zeilen- und Spaltenlayout impliziert, obwohl dies wiederum der Fall ist kann Beispiele nehmen, um das zu verdeutlichen.)
Vor- und Nachteile für diese Art von Handlung sind ebenfalls einfach, aber ich werde einige darlegen. Da ich diesen Entwurf (der mindestens bis in die 1930er Jahre zurückreicht) sehr mag, möchten andere vielleicht schärfere Kritik üben.
+1. Die Idee ist auch für nicht-technische Gruppen leicht zu verstehen . Balkenhöhen oder Balkenlängen codieren in diesem Beispiel Frequenzen. In anderen Beispielen können sie nach Belieben berechnete Prozente, Residuen usw. codieren.
+2. Die Zeilen- und Spaltenstruktur entspricht der einer Tabelle . Sie können auch numerische Werte hinzufügen. Sehr kleine Mengen und sogar implizite Nullen sind deutlich zu erkennen, was bei anderen Designs (z. B. gestapelten Balkendiagrammen, Mosaikplots) nicht immer der Fall ist. Die Beschriftung von Zeilen und Spalten ist in der Regel effizienter als das Hinzufügen eines Schlüssels oder einer Legende mit dem dazu erforderlichen mentalen "Hin und Her". Auf diese Weise kombiniert dieses Design Grafik- und Tabellenideen, was einige Leser anscheinend beunruhigt. Umgekehrt würde ich behaupten, dass starke Unterschiede zwischen Abbildungen und Tabellen nur historische Kater sind, die jetzt überholt sind, da Forscher ihre eigenen Dokumente erstellen können und nicht mehr auf Designer, Komponisten und Drucker angewiesen sind.
+3. Erweiterungen auf Dreiwege-Bauformen und höhere Bauformen sind prinzipiell einfach . Platzieren Sie zwei oder mehr Variablen als zusammengesetzte Variablen auf einer oder beiden Achsen oder geben Sie ein Array solcher Diagramme an. Natürlich ist die Interpretation umso komplizierter, je komplizierter das Design ist.
+4. Das Design erlaubt eindeutig ordinale Variablen auf jeder Achse. Die Reihenfolge kann (z. B.) durch geeignete Schattierung sowie durch die Reihenfolge der Kategorien auf dieser Achse ausgedrückt werden. Die Kategoriereihenfolge der Achsen kann durch ihre Bedeutung oder besser durch die Häufigkeit bestimmt werden. Die alphabetische Reihenfolge nach Textbezeichnungen ist möglicherweise eine Vorgabe, sollte jedoch niemals die einzige in Betracht gezogene Wahl sein.
-1. Durch die allgemeine Gestaltung kann das Diagramm bestimmte Arten von Beziehungen weniger effizient darstellen . Insbesondere ein Mosaikplot kann Abweichungen von der Unabhängigkeit sehr deutlich machen. Wenn umgekehrt die Beziehungen zwischen kategorialen Variablen kompliziert oder unklar sind, kann in der Regel kein Diagramm mehr als diese schwache Tatsache anzeigen.
-2. In gewisser Weise ist das Design ineffizient bei der Raumnutzung , da für jede Kreuzkombination Platz bleibt, unabhängig davon, ob oder wie häufig sie auftritt. Dies ist das Laster des gleichen Prinzips, das als Tugend angesehen wird. Das besondere Design über Räumen kategorisiert gleichermaßen unabhängig von ihrer Häufigkeit; das opfern opfert oft lesbare randbeschriftungen, die ich sehr schätze. In diesem Beispiel sind die Beschriftungen sehr kurz, aber das ist alles andere als typisch.
Hinweis: Die Daten von xan scheinen nur erfunden zu sein, daher werde ich nicht mehr eine Interpretation versuchen, als in anderen Antworten versucht wird. Aber einige hausgemachte Weisheiten verdienen hier das letzte Wort: Das beste Design für Sie ist eines, das Ihnen und Ihren Lesern die Struktur einiger realer Daten, die Sie interessieren, am besten vermittelt.
Andere Beispiele schließen ein
Wie können Sie die Beziehung zwischen 3 kategorialen Variablen visualisieren?
Diagramm für die Beziehung zwischen zwei Ordnungsvariablen