Es scheint, dass das häufigste Problem bei diesen Arten von "Flusskarten" darin besteht, dass viele Linien, wenn sie enthalten sind, so stark kollidieren, dass es schwierig ist, ein nicht offensichtliches Muster zu erkennen (wenn wechselseitige Flüsse berücksichtigt werden, passiert dies) in noch größerem Umfang). Auch die langen Linien dominieren tendenziell die Grafik, obwohl es durchaus möglich ist, dass die Verteilung der Flüsse überwiegend über kurze Räume erfolgt (zum Beispiel ähneln eine Vielzahl unterschiedlicher Verteilungen zwischen Orten in der Regel Levy-Flügen ). Ich nehme an, dass dies nicht unbedingt eine schlechte Sache ist (die langen Schlangen mögen an sich interessanter sein als die kurzen Schlangen für viele Phänomene), aber ich denke nicht, dass wir sozusagen den Wald vor lauter Bäumen verlieren wollen.
Obwohl ich nicht bezweifle, dass ich einige mögliche "Lösungen" verpasst habe, die vorgeschlagen wurden, werde ich versuchen, einige der Möglichkeiten zusammenzufassen, wie Einzelpersonen versucht haben, das Problem in der Arbeit zu lösen, auf das ich gestoßen bin.
Verzerren der Linien
Wenn Sie einige der anderen Themen auf dem Bildschirm lesen, werden Sie einige Beispiele dafür sehen, wie Menschen mit diesem Problem umgegangen sind. Insbesondere sind die Linien verzerrt, damit sie sich nicht mit anderen Objekten auf der Karte überlappen. Whubers Antwort auf eine andere ähnliche Frage (bereits in einem Kommentar erwähnt) ist ein Beispiel dafür. Eine Präsentation einiger Forscher in Stanford zeigt dieselbe Idee (Phan et al., 2005). Vielen Dank für diese Präsentation geht an dslamb für diese Antwort in einem anderen Thread (und alle Antworten auf diesen Thread werden auch für Ihre Frage von Interesse sein). Ich finde es besonders interessant, dass eines der wichtigsten Beispiele dafür die alte Einwanderungskarte von Minard ist, die ein Beispiel für eine wünschenswerte Ausgabe ist (um 1864!).
In Anbetracht Ihres speziellen Anwendungsfalls (geringe Anzahl von Knoten und Linien) scheint dies ausreichend zu sein. Die anderen "Lösungen", die ich vorstelle, dienen eher der Visualisierung von Daten mit vielen Zeilen und vielen Ursprungszielen (obwohl ich davon ausgehe, dass sie nützliche Zusammenfassungen für die Community im Allgemeinen sind, mache ich trotzdem weiter).
Verwenden von Alpha-Überblendung, Farbe und Linienbreite / -höhe
Die Karten I in demselben Thread aufgeführten zuvor angemerkt, Darstellung der Netzströme sind Beispiele hierfür. Die Facebook-Freunde sind ein guter Fall, um die Alpha-Ebene von Linien anzupassen, sodass viel mehr Flüsse erforderlich sind, um eine dunklere (oder in diesem Fall hellere) Verbindung zwischen den beiden Orten darzustellen. Dies betont auch die längeren Leitungen, da sie seltener auftreten. Eine ähnliche Logik stammt aus Value-by-Alpha-Karten für Polygonbereiche (Roth et al., 2010), die bereits in diesem Forum erwähnt wurden .
Die andere Karte, die ich in derselben Antwort präsentiere, verwendet Farbe und eine nicht traditionelle 3D-Lichtbogenlinie (Ratti et al., 2010). Die Autoren verwendeten ein Clustering-Kriterium, um homogene Bereiche zu gruppieren und farblich zu kennzeichnen (per Definition weisen die Bereiche innerhalb der Farbe ähnlichere Flussmuster auf als zwischen den Farben). Die Clustering-Kriterien an und für sich könnten interessant sein, um Muster in den Daten zu identifizieren, obwohl es ein wahrscheinliches Problem damit zu sein scheint, wie Andrew Gelman erwähnt hat , dass es Ihnen ziemlich genau sagt, was Sie bereits wissen, dass es näher beieinander liegt neigen dazu, mehr Verbindungen zu haben.
Schließlich füge ich in diese Kategorie Techniken ein, mit denen die Linien (ähnlich wie beim Alpha-Blending) entweder anhand der Linienbreite oder im Fall der perspektivischen 3D-Linienhöhe gewichtet werden, um das Volumen des Flusses zu übermitteln. Auf der Seite auf Toblers Seite für die Flow-Mapping-Software finden Sie einige Beispiele in 2d (und der andere Artikel, den ich erwähnt habe, ist ein Beispiel in 3d mit Linienhöhen). Auch auf dieser Seite hat Tobler einen sehr nützlichen Artikel, der die Probleme mit Flowmapping und ihre historische Anwendung beschreibt (Tobler, 1987).
Ein weiteres Beispiel in 3d ist diese Antwort eines Mankoffs auf dieser Site. Dieser Beitrag im Blog "Soziologische Bilder" zeigt eine nützliche Möglichkeit in einem Flussdiagramm, zwischen Ein- und Ausflüssen zu unterscheiden (obwohl dies wiederum funktioniert, da die Anzahl der Knoten relativ gering und die Knoten im Netzwerk angeordnet werden können eine willkürliche Methode, um Überzeichnungen zu reduzieren). Dieselben Arten von Pfeilen (und einige andere, die Haschings verwenden) sind auch in (Tobler, 1987) enthalten.
Am Ende lösen Linienbreite und Farbe das Überzeichnungsproblem jedoch nicht wirklich. Die Bögen in 3D helfen etwas, obwohl ich denke, dass sie bei komplizierteren Flussmustern nur einen begrenzten Nutzen haben werden. IMO-Alpha-Blending scheint in einer Vielzahl von Situationen dieser drei am nützlichsten zu sein, aber Farbe und Linienbreite könnten / sollten in Verbindung mit der oben erwähnten Linienverzerrung verwendet werden.
Datenreduzierung
Ich gruppiere hier zwei Arten von Techniken: 1) Verwenden kleiner Mehrfachkarten (dh vieler Karten mit inhärent weniger Objekten zur Visualisierung, damit das Überzeichnen reduziert wird) oder 2) andere grafische Darstellungen, die keine Linien sind, sondern einige der Flüsse über die Dichte darstellen oder Choroplethenkarten. Beispiele hierfür finden sich in (Corcoran et al., 2009; Rae, 2009; Wood et al., 2010) (danke an iant für die Rae-Referenz). Diese neigen dazu, die Menge an visuellen Informationen zu reduzieren, die entweder durch die Darstellung einer Reihe kleiner Mehrfachkarten (oder nur eines kleineren Bereichs) oder durch die Verwendung eines Choroplethen-Zuordnungsschemas zur Darstellung einer Statistik dargestellt werden (Beispiele könnten die Anzahl der Zuflüsse und die Anzahl der Abflüsse sein , Richtung der Strömungen, durchschnittliche Entfernung der Strömungen). Wenn Sie Daten auf Punktebene haben, können Sie diese Statistiken über Rasterkarten für die Kerndichte darstellen oder sie zu Quadraten zusammenfassen.
Wenn Informationen auf diese Weise reduziert werden, ist das Überzeichnen weniger ein Problem. Ein sehr cooles interaktives Online-Beispiel ist diese Migrationskarte des Forbes-Magazins . Sie können jeweils nur einen Landkreis sehen, aber die Reduzierung der Informationen erleichtert das Parsen der Zeilen (und den Unterschied zwischen Zu- und Abflüssen) erheblich. Ein kürzlich veröffentlichter Beitrag im ESRI-Mapping-Blog verwendet ebenfalls eine ähnliche Technik für die kleinen Vielfachen (sie wählen auch eine bestimmte Projektion für die Weltkarte aus, um "hübsch aussehende" Linien zu haben, und verwenden Farben gut, um verschiedene internationale Ursprünge weiter hervorzuheben). In diesem Beispiel funktioniert es ziemlich gut, da das Endziel für alle Flows gleich ist, aber wenn Flows wechselseitig sein könnten, würde es wahrscheinlich nicht so gut funktionieren.
Verwenden anderer nicht kartierter Darstellungen von Flüssen
Andere auf dieser Website haben vorgeschlagen, alternative Diagramme zur tatsächlichen Karte zu verwenden, um die Flüsse darzustellen (nur die Ursprünge und Ziele auf eine andere Weise als ihren tatsächlichen geografischen Standort abzubilden). Beispiele hierfür sind entweder spezielle Visualisierungen (wie die von Circos erstellten ), Bogendiagramme (siehe dieses Beispiel bei Protovis, diese werden auch als Kriskogramme bezeichnet (Xiao & Chun, 2009)) oder Matrix-Heatmaps ( hier ist ein weiteres Beispiel aus dem Protovis-Website). Eine andere Möglichkeit wäre die Verwendung eines automatisierten Netzwerklayouts, um Muster in den Flüssen zu identifizieren (wie das von Graphviz ). Neben Graphviz scheinen Gephi, die NetworkX-Python-Bibliothek und einige R-Bibliotheken ebenfalls beliebte Tools zu sein (siehediese Antwort auf der Statistikseite).
Die Bibliotheken, die ich zitiere, sind ziemlich cool, da sie auch interaktive Visualisierungen entwickelt haben. Hier ist ein Beispiel mit einem ähnlichen Stil wie die kreisförmigen Grafiken (obwohl nicht kreisförmig!). Hier ist eine weitere interaktive Visualisierung unter Verwendung einiger der zuvor diskutierten Linienverzerrungstechniken, der Netzwerkplatzierung (die kreisförmigen Dorling-Kartogrammen ähnelt) sowie anderer nützlicher statistischer Zusammenfassungen (ich habe diese beiden Beispiele ursprünglich im Blog zur Informationsästhetik gesehen ).
Einige andere Ressourcen, die ich für nützlich halte, sind die Software und Artikel aus dem Spatial Data Mining und Visual Analytics Lab . Auch die Modellierung der Nachfrage nach Kriminalitätsreisen im CrimeStat-Programm ist eine sanfte Einführung in anwendbare Regressionstechniken für solche Flussdaten. Mit beiden Tools können Sie möglicherweise interessante Korrelationen in den Flussmustern mit anderen geografischen Informationen identifizieren. Ein weiterer Ort, an dem Sie möglicherweise nützliche Anregungen für die grafische Darstellung der Daten oder die statistische Analyse erhalten, ist eine aktuelle Ausgabe im Journal of Computational and Graphical Statistics, Band 20, Ausgabe 2zur Prüfung der Flugankunfts- / Abflugstatistik für kommerzielle Fluggesellschaften in den USA von 1987 bis 2008 (wenn Sie an der Verarbeitung von Big Data interessiert sind, lohnt es sich auch, diese zu prüfen). Alle Artikel sind kostenlos und mit jedem Papier versehen.
Am Ende bestimmen die Daten und das Medium, wie gut einige dieser Techniken die visuelle Unordnung reduzieren, die mit Flussdaten einhergeht. Ich hoffe, dass dies ein nützlicher Ort ist, um Ideen zu finden, wie man mit diesem Visualisierungsproblem umgeht. Wenn Sie Ihre Frage weiter verfeinern, um herauszufinden, was Sie erreichen möchten, können andere nützliche Rückmeldungen zu tatsächlichen programmatischen Implementierungen geben (falls noch nichts verfügbar ist).
Zitate
- Corcoran, Jonathan, Prem Chhetri und Robert Stimson. (2009) Verwenden zirkulärer Statistiken, um die Geographie des Weges zur Arbeit zu erkunden. Papers in Regional Science 88 (1): 119-132.
- Phan, Doantam, Ling Xiao, Ron Yeh, Pat Hanrahan und Terry Winograd. (2005) Flow Map Layout. In Information Visualization, 2005. INFOVIS 2005. IEEE-Symposium : 219–224. | PDF hier
- Rae, Alasdair. (2009) Von räumlichen Interaktionsdaten zu räumlichen Interaktionsinformationen? Geovisualisierung und räumliche Strukturen der Migration aus der Volkszählung von 2001 in Großbritannien. Computer, Umwelt und städtische Systeme 33 (3): 161-178. | PDF hier
- Ratti, Carlo, Stanislav Sobolevsky, Francesco Calabrese, Clio Andris, Jonathan Reades, Mauro Martino, Rob Claxton und Steven H. Strogatz. (2010) Neuzeichnung der Karte von Großbritannien aus einem Netzwerk menschlicher Interaktionen. PLoS ONE 5 (12). Artikel ist offener Zugang von Link
- Roth Robert E., Andrew W. Wooddruff und Zachary F. Johnson. (2010) Value-by-Alpha-Karten: Eine alternative Technik zum Kartogramm. The Cartographic Journal 47 (2): 130-140. | PDF hier
- Tobler, Waldo R. (1987) Experimente zur Migration von Computern per Computer. Kartographie und Geoinformationswissenschaft 14 (2): 155-163 | PDF hier
- Holz, Jo, Jason Dykes & Aidan Slingsby. (2010). Visualisierung von Ursprüngen, Zielen und Flüssen mit OD-Karten. The Cartographic Journal 47 (2): 117-129. | PDF hier
- Xiao, Ninchuan & Yongwan Chun. (2009) Visualisierung von Migrationsabläufen mithilfe von Kriskogrammen. Kartographie und Geoinformationswissenschaft 36 (2): 183-191.
* Hinweis: Links zu nicht verknüpften PDF-Dokumenten sind enthalten, wenn ich eines finden konnte