Sollte entweder die Fläche oder die Länge eines Quadrats proportional zu den Daten sein, die visualisiert werden?


16

Ich mache eine Datenvisualisierung. Jedes Datum wird durch ein Quadrat dargestellt. Um die zugrunde liegenden Daten intuitiv lesbar zu machen, sollte die Länge der Seiten jedes Quadrats oder die Fläche jedes Quadrats proportional zu dem Datum sein, das es darstellt?


1
Noch nicht. Ist es breit? Ich hatte gehofft, dass die Antwort eindeutig war (ich nehme an, es ist "Gebiet"), aber dass die Leute hier mehr Grafikdesign- und Wahrnehmungspsychologie-Wissen haben würden, um das zu unterstützen.
Dumbledad

1
IIRC Dies wurde in einem deutschen Buch behandelt, das ich einmal gelesen habe: "So lügt man mit Statistik" von en.wikipedia.org/wiki/Walter_Krämer - nicht sicher, ob es ein englisches Äquivalent gibt. TL; DR - hängt davon ab, was Ihre Leser aus den Visualisierungen lesen sollen.
Michael Schumacher

Die Antwort ist sicherlich nicht eindeutig. Es hängt alles von Einzelheiten ab - nämlich davon, welche Daten Sie präsentieren, wie Sie sie präsentieren und was Sie mit diesen Daten kommunizieren möchten.
DA01

Können Sie Beispiele nennen, bei denen die Einzelheiten oder das, was die Leser aus der Visualisierung lesen sollen, uns veranlassen würden, die Länge der Seite eines Quadrats proportional zum Bezugspunkt anstelle der Fläche des Quadrats zu wählen?
Dumbledad

5
+1 Warum erhält jede interessante Frage mindestens eine knappe Stimme?!? <grump>
user56reinstatemonica8

Antworten:


10

Wenn Sie, der Schöpfer, unsicher sind, wie wird der Leser wissen, welches es ist?

Kurze Antwort: Der Wert sollte 1: 1 mit der Farbmenge auf der Seite verknüpft werden . In Ihrem Beispiel sollte es sich also um eine Fläche handeln. Aber es gibt noch mehr: Sie müssen auch irreführende Hinweise vermeiden, die den Leser dazu bringen könnten, sie falsch zu lesen, und Sie müssen wissen, warum Sie Fläche statt Länge verwenden (z. B. Balkendiagramme), da sie echte Vor- und Nachteile haben.


Erstens: Ändern Sie niemals sowohl Länge als auch Breite (dh Fläche) einer Form, wenn die Variable tatsächlich nur mit der Länge einer Seite verknüpft ist. Wenn X das Doppelte von Y ist, Y jedoch viermal so viele Farben auf der Seite hat, führen Sie Ihre Leser in die Irre. Diese Art von Verzerrung wird manchmal als " Lügenfaktor " bezeichnet und wird oft als bewusster Versuch angesehen, Unterschiede irrezuführen und zu übertreiben.

Bildbeschreibung hier eingeben


Wenn Sie Fläche als Maß verwenden, würde ich dringend empfehlen:

  • Wissen, warum Sie Bereich verwenden . Wenn Sie Fläche anstelle einer linearen Abmessung wie Länge verwenden, haben Sie folgende Möglichkeiten:

    • Opfere die Fähigkeit, Unterschiede mathematisch klar zu erkennen (du kannst nicht einfach sagen "schau, das ist doppelt so viel wie das andere")
    • Bitten Sie Ihre Leser, es auf eine intuitive, alltägliche, nicht numerische Art und Weise zu betrachten, wie beispielsweise Leute die Größe von Torten in einem Geschäft vergleichen. Weniger anspruchsvoll, aber unmittelbarer. Mehr Bauch, weniger Kopf.
    • Kleine Unterschiede zwischen sehr ähnlichen Zahlen werden fast unsichtbar.
    • Wenn eine Variable um ein Vielfaches kleiner ist als eine andere, verschwindet die sehr kleine Variable nicht so schlimm wie in einem Balkendiagramm, wodurch mehr Flexibilität in Layouts möglich ist.

Bildbeschreibung hier eingeben

  • Erwägen Sie die Verwendung von Kreisen für Flächen, nicht Quadrate, zentriert :

    • Kreise, weil sie nicht zu Verwechslungen mit Balkendiagrammen und Ähnlichem führen. Höhe und Breite sind weniger im Vordergrund: Es sieht weniger danach aus, als würden Sie einen Vergleich auf der Basis von Höhe oder Breite durchführen.
    • Center-Alignment, weil es nicht dazu einlädt, Höhen zu vergleichen

Bildbeschreibung hier eingeben

Oben ist es beispielsweise schwierig, das mit "5" bezeichnete Quadrat als Dreiviertel der Höhe des mit "10" bezeichneten Quadrats zu sehen, sodass es möglicherweise irreführend ist.

Die Kreise laden nicht zu einem solchen Vergleich ein: Es ist eher ein Bauchgefühl, ein Moment "Dieser Blob ist ziemlich viel größer als der nächste Blob".


Es gibt eine Vielzahl von Beweisen, von Benutzertests bis hin zu kleinen Studien (wir werden später versuchen, einige Beispiele zu finden), dass diese Art des intuitiven bereichsbezogenen Vergleichs ansprechender sein kann, die Barriere für den Zugang zu weniger ansprechenden Zielgruppen senken kann und kann Konzentrieren Sie sich dabei nicht auf die kalten Zahlen, sondern auf das Thema. Dies geht jedoch zu Lasten einer numerischeren Analyse.

Wählen Sie aus ästhetischen Gründen nicht zwischen eindimensional (Länge oder Entfernung) und zweidimensional (Fläche): Wählen Sie zwischen ihnen basierend auf Ihrer Zielgruppe und Ihrer Botschaft.

Was ist besser für die Kommunikation geeignet: Sofortige Vergleiche auf Darmebene auf der Ebene "das ist viel größer" oder eher als numerische Vergleiche auf der Ebene "das ist etwa 80% des anderen"?

Oder gibt es praktische Gründe, warum Sie Fläche nutzen müssen?

Wenden Sie dann, wenn Sie sich aus praktischen Gründen entschieden haben, die Ästhetik an.


Das Verhältnis zur Farbmenge auf der Seite ist eine sehr nützliche Faustregel (zumindest in 2D). danke dafür werde ich es benutzen. Das Design, zu dem ich mich bewege, basiert auf Kreisen. Ich denke, du bist genau dort
Dumbledad,

5

Ich würde die Gegend sagen. Optisch zeigt sich ein Quadrat mit einer doppelt so langen Seite als eine viermal so große Fläche. Gelegenheitsbeobachter werden sich auf das Gebiet beziehen, auch ohne Ihre Legende zu lesen.

Ein schönes Beispiel ist diese legendäre Grafik von xkcds Randall Munroe:

Bildbeschreibung hier eingeben ( große, lesbare Version )


4

Wir sind nicht so gut darin, Unterschiede in der Fläche zu beurteilen, wie wir in der Länge sind. Wir verwenden Länge als Proxy und neigen daher dazu, Unterschiede in Bereichen zu unterschätzen.

Aus diesem Grund erscheint ein Kreis, der tatsächlich die doppelte Fläche eines anderen hat, zu klein, weil unser Gehirn ihre Radien in Beziehung setzt, die sich um den Faktor 1,4 unterscheiden.

Es gibt interessante Versuche, dieses Phänomen in Einklang zu bringen, z. B. die proportionale Symbolzuordnung in R , in der die perzeptive Skalierung von Symbolen vorgeschlagen wird, um eine engere Übereinstimmung mit der Beurteilung von Längen und Flächen zu erzielen.

Hier ist Abb. 2 aus dieser Arbeit

Bildbeschreibung hier eingeben

Persönlich habe ich keine Erfahrung damit und vermeide es, Bereiche zu nutzen, wenn quantitative Beurteilungen erforderlich sind.

Eine interessante Tangente ist die Beziehung zwischen der Wahrnehmung von Volumen und Länge. Der Unterschied, wie wir diese wahrnehmen, ist noch auffälliger. Dies kann in diesem Video von Sterngrößenvergleichen veranschaulicht werden .

Wenn Sie den größten Stern erreichen, der etwa das 1.700-fache des Sonnendurchmessers beträgt, haben Sie den Eindruck, dass er viel größer als das 1.700-fache ist.

Eine systematischere Darstellung unseres Fehlers bei der Wahrnehmung von Unterschieden in Bereichen und Längen finden Sie unter Crowdsourcing - Grafische Wahrnehmung: Verwenden von Mechanical Turk zur Bewertung des Visualisierungsdesigns von Jeffrey Heer und Michael Bostock.


4

Meiner Meinung nach der Bereich (D), nicht jede Seite (E).

Wenn Sie eine Seite mit der Länge 2 verwenden, ist die Fläche viermal so groß wie der Wert, und Sie erhalten ein sehr überlappendes Diagramm. (E)

Wenn Sie ein normales Balkendiagramm (A) haben, sind die Daten linear und das Mit des Balkens dient nur der Ästhetik. (B)

In diesen Fällen ist der Bereich wieder repräsentativ für die Daten, da die mit den Balken identisch sind. Sie können eine 3D-Leiste haben und dennoch ist das Volumen der Leiste dasjenige, das die Daten darstellt (C)

Diagramme zur Veranschaulichung der Größenunterschiede und -überschneidungen


4 Mal? Ist es nicht der Unterschied zwischen linear und quadratisch?
Dumbledad,

Lassen Sie mich den Beitrag illustrieren und bearbeiten.
Rafael

Angenommen, das Datum ist 81. Wenn wir area verwenden, haben die Seiten eine Länge von 9, was eine Fläche von 81 ergibt. Wenn wir side verwenden, haben sie eine Länge von 81 und die Fläche beträgt 6.561. 81 ist nicht 4 mal 9 und 6.561 ist nicht 4 mal 81. Woher bekommen Sie 4?
Dumbledad

"Wenn Sie eine Seite der Länge 2 verwenden, ist die Fläche viermal so groß wie der Wert" Ich kann nicht sagen, was Sie dort sagen wollen. Ich denke, Sie meinen, wenn Sie die Länge der Seite verwenden, um die Größe der Daten darzustellen, multipliziert das Verdoppeln des Datenwerts die Fläche mit vier.
David Richerby

David - das ist meine Arbeit! In Rafaels ursprünglichem Beitrag stand: "Wenn Sie eine Seite verwenden, ist die Fläche viermal so groß wie der Wert". Wenn Sie einen besseren Weg kennen, dies zu klären, tun Sie dies bitte.
Dumbledad

1

Tufte beschäftigte sich ausführlich damit. Sehen:

  • Die visuelle Darstellung quantitativer Informationen,
  • Informationen und andere vorstellen.

Einige Prinzipien der grafischen Integrität:

  1. Die Darstellung von Zahlen, die physikalisch auf der Oberfläche des Diagramms selbst gemessen werden, sollte direkt proportional zu den dargestellten numerischen Größen sein
  2. Eine klare, detaillierte und gründliche Kennzeichnung sollte verwendet werden, um grafische Verzerrungen und Mehrdeutigkeiten zu beseitigen. Schreiben Sie Erklärungen zu den Daten in die Grafik. Beschriften Sie wichtige Ereignisse in den Daten.
  3. Datenvariation anzeigen, keine Designvariation.
  4. In Zeitreihenanzeigen von Geld sind deflationierte und standardisierte Geldmengeneinheiten fast immer besser als nominale Einheiten.
  5. Die Anzahl der dargestellten informationstragenden (variablen) Dimensionen sollte die Anzahl der Dimensionen in den Daten nicht überschreiten. Grafiken dürfen keine Daten aus dem Kontext zitieren.

In Ihrem Fall müssen Sie sich fragen, ob die Daten besser durch ein 2D- oder 3D-Bild oder eine Linie dargestellt werden. Ein Würfel, ein Quadrat und eine Linie sind nicht dasselbe. Dies ist einer der Gründe, warum 3D-Balkendiagramme so häufig irreführend sind.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.