Während ich mich auf einen Vortrag vorbereite, den ich in Kürze halten werde, habe ich kürzlich angefangen, mich mit zwei wichtigen (kostenlosen) Tools für die interaktive Datenvisualisierung zu befassen : GGobi und mondrian - beide bieten eine große Auswahl an Funktionen (auch wenn sie etwas fehlerhaft sind).
Ich möchte Sie um Ihre Hilfe beim Artikulieren bitten (sowohl für mich selbst als auch für mein zukünftiges Publikum). Wann ist es hilfreich, interaktive Handlungen zu verwenden? Entweder zur Datenexploration (für uns selbst) oder zur Datenpräsentation (für einen "Kunden")?
Wenn ich einem Kunden die Daten erkläre, sehe ich den Wert der Animation für:
- Verwenden Sie "Identifizieren / Verknüpfen / Putzen", um zu sehen, welcher Datenpunkt in der Grafik was ist.
- Präsentation einer Sensitivitätsanalyse der Daten (zB: "Wenn wir diesen Punkt entfernen, erhalten wir Folgendes)
- Darstellung der Auswirkung verschiedener Gruppen in den Daten (z. B .: "Schauen wir uns unsere Grafiken für Männer und jetzt für Frauen an")
- Den Einfluss der Zeit (oder des Alters oder allgemein, um der Präsentation eine andere Dimension zu verleihen) zeigen
Wenn ich die Daten selbst erkunde, kann ich den Wert von Identifizieren / Verknüpfen / Putzen erkennen, wenn ich einen Ausreißer in einem Datensatz erkunde, an dem wir arbeiten.
Abgesehen von diesen beiden Beispielen bin ich mir nicht sicher, welche andere praktische Anwendung diese Techniken bieten. Speziell für unsere eigene Datenexploration!
Es könnte argumentiert werden, dass der interaktive Teil gut ist, um (zum Beispiel) ein unterschiedliches Verhalten verschiedener Gruppen / Cluster in den Daten zu untersuchen. Aber wenn ich mich (in der Praxis) einer solchen Situation näherte, bestand meine Neigung darin, die relevanten statistischen Verfahren (und Post-Hoc-Tests) durchzuführen - und was ich als signifikant fand, plottete ich dann mit Farben, die die Daten klar auf die Daten verteilten relevanten Gruppen. Soweit ich gesehen habe, ist dies ein sicherer Ansatz, als sich über die Daten zu "wundern" (was leicht zu Datenverbesserungen führen kann, wenn der Umfang des für die Korrektur erforderlichen Mehrfachvergleichs nicht einmal klar ist).
Ich würde mich sehr freuen, Ihre Erfahrungen / Gedanken zu diesem Thema zu lesen.
(Diese Frage kann ein Wiki sein - obwohl sie nicht subjektiv ist und eine gut durchdachte Antwort gerne meine "Antwort" -Marke gewinnt :))