Lernressourcen zum Erstellen von Datenvisualisierungen?


19

Ich bin daran interessiert zu lernen, wie Sie die Art von Visualisierungen erstellen, die Sie unter http://flowingdata.com und informationisbeautiful sehen. EDIT: Das heißt, Visualisierungen, die für sich selbst interessant sind - ein bisschen wie die NY Times-Grafiken, im Gegensatz zu einem schnellen Etwas für einen Bericht.

Mit welchen Tools werden diese erstellt - handelt es sich hauptsächlich um Adobe Illustrator / Photoshop? Was sind gute Ressourcen (Bücher, Websites usw.), um zu lernen, wie diese Tools insbesondere für die Datenvisualisierung verwendet werden?

Ich weiß, wie Visualisierungen aussehen sollen (und bin mit den Gestaltungsprinzipien vertraut, z. B. aus Tuftes Büchern), aber ich habe keine Ahnung, wie ich sie erstellen soll.

Antworten:


20

Das Fließen von Daten bespricht regelmäßig die von ihm verwendeten Tools. Siehe zum Beispiel:

Er zeigt auch sehr detailliert, wie er gelegentlich Grafiken macht, wie zum Beispiel:

Es gibt auch andere Fragen auf dieser Seite:

IMO, versuchen Sie:

  1. R und ggplot2: Dies ist ein gutes Einführungsvideo , aber die ggplot2-Website enthält viele Ressourcen.
  2. Verarbeitung: viele gute Tutorials auf der Homepage .
  3. Protovis: auch eine Fülle großartiger Beispiele auf der Homepage .

Sie können diese anschließend mit Adobe bereinigen.

Sie können sich auch das R- webvisPaket ansehen , obwohl es nicht so vollständig ist wie ggplot2. Von R aus können Sie diesen Befehl ausführen, um das Beispiel von Playfair's Wheat zu sehen:

install.packages("webvis")
library(webvis)
demo("playfairs.wheat")

Schließlich sind meine bevorzugten kommerziellen Anwendungen für die interaktive Visualisierung:


1
Super, tolle Links! Ich benutze bereits R und ggplot2, aber die Visualisierungen von dort scheinen mehr von der "Graphics for a Report" -Variante zu sein, als von der "Eye Candy / Visualization Interest an sich" -Variante, die ich suche. (ggplot2 ist super schön, aber nicht wirklich dazu gedacht, unbegrenzte Kreativität zu ermöglichen.) Irre ich mich? Oder verwenden Sie manchmal R / ggplot2 als Eingabe für ein anderes Visualisierungstool?
geregtin

5

Bereits erwähnte Verarbeitung hat einen schönen Satz Bücher zur Verfügung. Siehe: 1 , 2 , 3 , 4 , 5 , 6 , 7

Sie werden viele Sachen , die im Internet zu Hilfe , die Sie mit R. beginnen finden Als nächster Schritt dann ggplot2 ausgezeichnetes Web hat Dokumentation . Ich fand Hadleys Buch auch sehr hilfreich.

Python könnte ein anderer Weg sein. Besonders mit Werkzeugen wie:

Alle Projekte sind im Web gut dokumentiert. Sie könnten auch überlegen, in einige Bücher zu blättern .

Schließlich könnte auch das Buch " Grafiken großer Datensätze " hilfreich sein.


igrapharbeitet auch in R; Verwenden Sie für 3D OpenGL beschleunigt in R rgl& misc3dPakete.

Auch matplotlibHandlungen sind hässlich; Sie können für einen langjährigen Gnuplot-Benutzer nett sein.

2

Sie werden viel Zeit damit verbringen, sich mit R vertraut zu machen.

RapidMiner ist kostenlos, Open Source und grafisch und verfügt über viele gute Visualisierungen, die Sie exportieren können.

Wenn Sie Geld übrig haben oder Universitätsmitarbeiter / -student sind, ist JMP auch verdammt gut. Es kann einige sehr hübsche Grafiken erstellen, sehr, sehr leicht. Kann in Flash oder PNG oder PDF exportieren oder was hast du.


5
1. IMHO Zeit mit R verbracht ist gut investiert, wenn Sie etwas Ernstes zu tun planen. 2. Betrachten Sie auch KNIME knime.org als RapidMiner-Alternative.
Radek

(+1) @radek. Ich bin auch ein Rapidminer-Fan, aber meiner Meinung nach ist es nicht flexibel genug für ausgefeilte Visualisierungen.
Steffen

Wenn Sie Erfahrung im Programmieren haben, brauchen Sie nicht mehr als einen Tag, um mit R vertraut zu werden. Was die Sprachen angeht, ist dies ziemlich einfach, und es gibt einige hervorragende Online-Tutorials.
naught101

1

Eine weitere gute Alternative ist die Protovis-Bibliothek http://vis.stanford.edu/protovis/

Es ist eine sehr gut gestaltete JavaScript-Bibliothek, die einige schöne Visualisierungen erstellen kann, wenn Sie die Zeit und die Fähigkeit haben, die bescheidene Menge an benötigtem JavaScript-Code zu schreiben.

Ich empfehle auch Tableau http://www.tableausoftware.com . Es eignet sich hervorragend zum schnellen Durchsuchen von Datensätzen und zum Erstellen vieler verschiedener Visualisierungen.

Beide Produkte haben Wurzeln in der Stanford Visualization Group.


1

Hier wurden viele hervorragende Antworten gegeben, und die Sprachen / Bibliotheken, die Sie lernen möchten, hängen von der Art der Visualisierung ab, die Sie durchführen möchten.

Wenn Sie jedoch regelmäßig Python verwenden, kann ich seaborn nur empfehlen . Es ist sehr anspruchsvoll in Bezug auf die Visualisierung statistischer Daten, sieht aber auch vom Standpunkt der Präsentation aus recht anspruchsvoll aus.

Nehmen wir ein Beispiel. Angenommen, Sie versuchen, den Stromverbrauch für ein Gewerbegebäude monatlich zu berechnen. Zu diesem Zweck könnte in matplotlib ein einfaches Liniendiagramm erstellt werden.

Wenn wir die Visualisierung jedoch komplexer und informativer gestalten möchten, könnten wir mit seaborn eine Heatmap generieren:

Heatmap

Eine Heatmap ist nur ein Beispiel. Einige andere gebräuchliche Verwendungen mit seaborn sind:

  • KDE-Plots
  • Schwarm Parzellen
  • Geigenpläne

Die Idee hinter seaborn ist, Daten auf eine intuitivere Art und Weise darzustellen, als dies mit einfacheren Diagrammen möglich wäre, z. B. mit Linien, Balken, Kreisen usw.

Wenn es Sie interessiert - hier finden Sie weitere Informationen zu seaborn: https://seaborn.pydata.org/



0

R ist großartig, aber es ist nicht so, dass R schwer zu erlernen ist. Es ist so, dass es unmöglich ist, in der Dokumentation nach einem anderen Namen zu suchen, wie Rq großartig wäre. Wenn Sie also ein Problem haben, ist die Suche nach einer Lösung ein Albtraum, und die Dokumentation ist auch nicht großartig. Matlab oder Octave werden großartig sein. Und diese Pläne in R oder Matlab zu bekommen, wäre sehr, sehr mühsam.

IMHO Post Processing Visuals ist der beste Weg. Viele von ihnen aus fließenden Daten stammen aus Adobe Illustrator oder Gimp. Es ist schneller. Sobald Sie die Struktur des Plots erhalten haben, ändern Sie die Details in einem Editor. Wenn Sie R als Editor verwenden, erhalten Sie nicht die gewünschte Flexibilität. Sie werden ständig nach neuen Paketen suchen.


R; function??- R hat Hilfe eingebaut. Sie können auch normalerweise nach "cran" suchen, um R-Zeug zu finden, und ich finde, dass die meisten großen Suchmaschinen mit dem einzelnen Buchstaben gut genug umgehen können.
Naught101

0

Hier ist ein YouTube-Tutorial zu D3.js , in dem die Grundlagen von HTML, SVG, CSS und JavaScript sowie das Laden von Daten und das Erstellen eines Balkendiagramms, Liniendiagramms und Streudiagramms mit D3.js vermittelt werden.

Video-Miniaturansicht



-3

Es gibt unendlich viele Ressourcen, aber Sie können sie einschränken, je nachdem, wie Ihre Daten transformiert werden sollen, mit wie vielen Datenquellen Sie es zu tun haben, wie sie gemeinsam genutzt werden müssen usw.

Hier ist eine Anleitung, wie Sie die richtige Ressource auswählen, die Sie in die richtige Richtung lenken kann.


1
Wenn Sie mit dieser Gruppe verbunden sind, geben Sie bitte ein Interesse an. Nur-Link-Antworten sind nicht besonders hilfreich. Die Hinweise unter stats.stackexchange.com/help/promotion können zutreffen.
Nick Cox
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.