Formatieren von Diagrammen: Wann ist es angebracht, eine Füllung unter einem Liniendiagramm zu verwenden?

12

Dies ist eine Frage zur Datenvisualisierung - ich hoffe, es ist in Ordnung, dies hier zu stellen.

Wann ist es angebracht, eine Füllung unter einem Liniendiagramm für eine Zeitreihe zu verwenden, wie im folgenden Diagramm? (die Ping-Zeiten über einen Tag zeigt)

Liniendiagramm mit Füllung darunter

Ich denke, es ist üblicher, eine einfache Linie ohne Füllung darunter zu verwenden, aber ist es in Ordnung, eine Füllung für die visuelle Vielfalt zu verwenden?

Ich wäre besonders daran interessiert, etwas über Wahrnehmungsforschung zu diesem Thema oder über Styleguides zu erfahren.

data-visualization

— Richard
quelle

1

Wenn 0sdie natürliche Untergrenze ist und Sie sie zeigen, warum dann nicht?

— TTNPHNS

1

Fragen Sie nach einer anderen Möglichkeit - warum sollten Sie fill verwenden, wenn dies nicht erforderlich ist? Stellen Sie sich vor, Sie möchten eine weitere Trendlinie hinzufügen, und die Dinge werden unnötig kompliziert. Ich würde auch die Einheit (en) der y-Achse und die Skala trennen.

— Martin

11

Es ist eine Kunst, ästhetische und informative Aspekte einer Grafik in Einklang zu bringen. Prominente Visualisierungsberater / -autoren wie Edward Tufte und Stephen Few wählen eine minimale Ästhetik, die eine Ablenkung von den informativen Teilen des Diagramms vermeidet. Für einige Zielgruppen ist jedoch ein gewisser Aufschwung gerechtfertigt - siehe beispielsweise die journalistische Anwendung der Datenvisualisierung von Alberto Cairo.

Der perzeptuelle Forschungswinkel besteht darin, dass jedes grafische Element eine Botschaft kommuniziert, von der wir einige nicht bewusst sind, weil unser visueller Kortex sich damit befasst (" prä-aufmerksame Verarbeitung "). Zusätzliche Elemente, auch redundante, können zu einer zusätzlichen Verarbeitung führen. Die entsprechende Grafik hängt von der zu übermittelnden Botschaft und dem Publikum ab.

Auf Ihre spezifische Frage hin hebt eine verbundene Linie einen Trend (und eine Abweichung von einem Trend) hervor. Der ausgefüllte Bereich hebt die Abweichung von der Grundlinie hervor. Ein Balken- oder Nadeldiagramm würde diskrete Ereignisse hervorheben, die von einer Grundlinie abweichen.

Der Kontext der Grafik ist ebenfalls wichtig. Wenn Sie ein Raster dicht gepackter Diagramme haben, hilft die Füllung dabei, jede Linie mit ihrer Grundlinie zu verknüpfen.

Eine weitere Überlegung beim Hinzufügen redundanter grafischer Elemente / Grafiken besteht darin, dass es schwieriger ist, das Diagramm mit informativeren Elementen zu erweitern. Beispielsweise möchten Sie möglicherweise spezielle Werte hervorheben, andere Trendlinien oder Overlay-Bänder überlagern, wie im folgenden Modell dargestellt.

Bildbeschreibung hier eingeben

— xan
quelle

1

Ich stimme dem zu. Sofern die Grafik nicht bunt sein muss, weil es sich um die Titelseite eines Magazins / Buches handelt (und die Marketingmitarbeiter dies wünschen), sollte zur Information Farbe verwendet werden. Wenn die Grafik "langweilig" aussieht, ist der Grund dafür die Tatsache, dass die zugrunde liegenden Informationen im Liniendiagrammformat nicht sehr interessant oder gar nicht sehr interessant sind. In solchen Fällen wäre es vielleicht in einem Tortendiagramm, Radarplot oder etwas anderem nützlicher.

— Rocinante

1

Ich schlage vor, kein Kreisdiagramm zu verwenden. Unterschiede in der Bogenlänge und der Keilfläche sind schwerer zu erkennen als Höhenunterschiede. Wenn Sie mir nicht glauben, vergleichen Sie ein Kreisdiagramm im Verhältnis 32:34:33 mit demselben Balkendiagramm. Welches ist leichter zu lesen?

— Shadowtalker

2

Ich habe allgemein gesprochen, nicht speziell für die obige Grafik. Jeder Diagrammtyp hat seine Vorzüge. Ein bestimmter Diagrammtyp ist nicht in allen Situationen geeignet .

— Rocinante

4

Noch ein paar Punkte zu beachten:

Wie in einem Kommentar erwähnt, ist eine Unterfüllung weitgehend ungeeignet, wenn sich die x-Achse nicht an einem natürlichen y-Nullpunkt befindet. Dies kann daran liegen, dass die y-Achse so skaliert ist, dass sie bei einer anderen Zahl als Null beginnt, oder dass die verwendeten Einheiten keine natürliche Nullinterpretation haben (z. B. Kelvin hat eine natürliche Null, Celsius nicht).

Zweitens liegt ein Fall, in dem eine Unterfüllung besonders gültig ist, vor, wenn die Daten selbst als unterfüllt betrachtet werden könnten. Zum Beispiel ist es sinnvoll, ein Liniendiagramm der Höhe eines Berges nicht vollständig auszufüllen. Die Füllfarbe steht für Erde, während ungefüllt für Luft steht.

Ein verwandtes Beispiel könnten Zähldaten sein. Wenn wir alle Individuen an jedem x-Punkt stapeln, erhalten wir ein Balkendiagramm. Wenn eine Interpolation zwischen den Balken sinnvoll ist, erhalten wir ein Liniendiagramm mit einer Unterfüllung.

Dieses Bild aus der 'visuellen Darstellung quantitativer Informationen' könnte es etwas besser erklären. Es zeigt, welche Militäreinheiten sich während des zweiten Krieges in Europa befanden (glaube ich). Wenn Sie die Einheiten zu jedem Zeitpunkt stapeln, erhalten Sie ein unterfülltes Balkendiagramm. Wenn Sie eine Linie über den Daten zeichnen, erhalten Sie ein unterfülltes Liniendiagramm.

— timcdlucas
quelle

2

... US- Militäreinheiten waren während des Ersten Weltkriegs in Europa (die Daten 1917 und 1918 erzählen die Geschichte).

— Nick Cox

@nickCox Natürlich. Keine Ahnung, warum ich das nicht gesehen habe.

— timcdlucas

4

Die beiden vorherigen Antworten behandeln die wichtigsten Punkte, aber es gibt ein paar Dinge, die noch erwähnt werden sollten.

Zunächst sollte ich sagen, dass ich mit dem extrem minimalistischen Ansatz der grafischen Darstellung nicht einverstanden bin - dass alle überflüssige Tinte weg sein muss. Ablenkende, nichtssagende Variationen sollten verschwinden. Eine durchgezogene Fläche im Vergleich zu einer einzelnen Linie kann jedoch den Blick besser fesseln und auf einen Blick mehr kommunizieren. Und wie Sie sagen, kann es "visuelle Vielfalt" hinzufügen.

Wie @xan jedoch betont, interpretiert dieser kurze Blick einen Bereich anders als eine Linie, und zwar teilweise unbewusst.

Ein Flächendiagramm impliziert eine Gesamtmenge, die sich auf der x-Achse ansammelt. Wenn Sie zwei Diagramme vergleichen und in einem Diagramm ein größerer Bereich ausgefüllt ist, zeigt Ihnen Ihr Blick, dass unabhängig von den Start- und Endwerten eine größere Summe vorliegt.

Im Gegensatz dazu zeigt ein Liniendiagramm einen sich ändernden Wert. Der Fokus liegt auf der Veränderung der Position von einem Punkt zum nächsten, nicht auf der Summe der akkumulierten Positionen.

Wann sollten Sie ein Flächendiagramm verwenden?

wenn die Werte eine eindeutige Größe mit einem in der Grafik angegebenen Nullpunkt darstellen;
wenn der Wert einen Betrag darstellt, der an jedem Punkt hinzugefügt (oder entfernt) wird, wie z. B. normaler täglicher Niederschlag oder monatlicher Gewinn / Verlust;
Wenn der Wert eine Verteilung einer Grundgesamtheit darstellt, bedeutet dies, dass die Gesamtfläche unter der Kurve die Gesamtgröße der Stichprobe darstellt, z. B. die Glockenkurve der Anzahl der Schüler mit unterschiedlichen Noten (im Grunde genommen ein geglättetes Histogramm).

Die Idee ist, dass beim Lesen des Diagramms, wenn Sie zwei Punkte auf der x-Achse nehmen, der zwischen ihnen gezeigte Bereich eine tatsächliche Menge von etwas darstellen sollte, das sich in diesem Bereich ansammelt. Aus diesem Grund würde ich bei Werten mit negativen Beträgen die Verwendung entgegengesetzter Farben für negative und positive Bereiche empfehlen, um zu betonen, dass sie sich in der Summe aufheben.

Wann sollten Sie kein Flächendiagramm verwenden?

wenn der Nullpunkt willkürlich ist (wie bei der nicht-absoluten Temperatur, wie @timcdlucas sagte), ungültig (wie bei Messungen, die ein Verhältnis von zwei Werten sind, wie ein Wechselkurs) oder aus Platzgründen nicht in der Grafik angezeigt wird;
wenn die durch die Höhe der Linie angezeigten Werte bereits eine kumulative Kennzahl darstellen, z. B. die Gesamtniederschlagsmenge (für den Monat / das Jahr) oder die Schulden / Ersparnisse;
wenn die Werte eher die Position / den Wert einer einzelnen sich ändernden Entität als eine Akkumulation darstellen;
Wenn Sie mehrere Linien in einem Diagramm vergleichen möchten (wenn Sie nicht den gesamten Bereich sehen können, verlieren Sie die Bedeutung. Vergleichen Sie stattdessen die Flächendiagramme nebeneinander).

Unter Berücksichtigung dieser Richtlinien kann Ihr Ping-Diagramm auf zwei Arten interpretiert werden.

Wenn Sie sich die Ping-Geschwindigkeit als eine einzige Variable vorstellen, die sich im Laufe des Tages ändert, ist ein einfaches Liniendiagramm am besten geeignet.

Wenn Sie dagegen die täglichen Ping-Geschwindigkeitsmuster von zwei verschiedenen Netzwerken (oder dasselbe Netzwerk an verschiedenen Tagen / Zeiträumen) vergleichen, möchten Sie möglicherweise die Gesamtzeit betonen, die für Netzwerkaufgaben erforderlich ist. Wenn Ihr Diagramm beispielsweise mehrere statt nur einen Spitzenwert aufweist, wird in einem Liniendiagramm die Variabilität der Geschwindigkeit hervorgehoben, während in einem Flächendiagramm die Gesamtverzögerung hervorgehoben wird.

Vergleichen Sie:
Liniendiagramm Gleiches Diagramm mit ausgefüllter Fläche
Die kumulative Summe ist in der ersten Hälfte des Diagramms (links von der roten Linie) geringfügig größer als in der zweiten, auch wenn die Peaks rechts höhere Maximalwerte erreichen. Durch das Ausfüllen wird der feste Block auf der linken Seite hervorgehoben, sodass er sich besser gegen die Spitzen ausbalanciert.

(Vergib die schlechte Bildqualität - konnte nicht herausfinden, wie R ein Flächendiagramm erstellen kann! Musste separat exportieren und bearbeiten.)

— AmeliaBR
quelle