Beibehalten von Kommentaren zu Diagrammen für die explorative Datenanalyse


8

Bei der Durchführung explorativer Datenanalysen drucke ich häufig die Grafiken aus und schreibe Kommentare / Anmerkungen usw. auf.

Haben die Leute Vorschläge für eine bessere elektronische Methodik? Ich interessiere mich besonders für Python / R.

Ich bin auf der Suche nach etwas 'Schnellem (und Schmutzigem)', das die Erkundungsarbeit nicht verlangsamt, sondern dabei hilft, die von mir gewonnenen Erkenntnisse zu protokollieren.

Was ich mir vorstellen kann, ist, Diagramme als PDFs zu generieren und dann Kommentare hinzuzufügen.

Idealerweise möchte ich die Option, dies programmgesteuert zu tun, damit ich, wenn ich die Grafiken wiederhole, die Kommentare 'automatisch' wieder hinzufügen kann.


1
Was ich manchmal mache, Rist, einen separaten Plot (auf einer separaten Seite am Ende des PDFs) hinzuzufügen und diesen für pasteeinige Kommentare zu verwenden.
Hplieninger

3
Dies sieht eher aus wie eine Programmierfrage und wenn ich richtig bin, erhalten Sie möglicherweise bessere Antworten auf R-Hilfe oder StackOverflow
mdewey

1
@mdewey, nun, ich betrachte es als statistischen Workflow in R - Ich stimme zu, dass meine "vorgeschlagene Lösung" nur "wie man Kommentare in ein PDF schreibt" ist, aber ich gehe davon aus, dass Statistiker dieses Problem schon einmal hatten und möglicherweise einen völlig anderen Ansatz vorschlagen auf das allgemeine Problem, die mit Grafiken verbundenen Notizen im Auge zu behalten.
Seanv507

3
Meine Schüler tun dies ohne Aufforderung, indem sie Diagramme in MS Word einfügen und Kommentare hinzufügen. Ich schätze das Interesse an automatisierten Methoden, die nur singen und tanzen, aber manchmal ist Low-Tech die beste Technologie.
Nick Cox

1
Ich denke, das ist von allgemeinem Interesse. Ich habe mir erlaubt, die Betonung auf Python / R zu verwässern, was hier den Richtlinien widerspricht.
Nick Cox

Antworten:


5

Hier ist eine einfache Lösung, die viele Leute als nützlich empfunden haben. Wenn Sie es trivial finden, werde ich nicht widersprechen. Dies umfasst statistische Software, Betriebssysteme und andere Computerdetails.

Kopieren Sie einfach Ihre Grafiken, fügen Sie sie in Ihr bevorzugtes Text- oder Textverarbeitungsprogramm ein und fügen Sie dann Ihre eigenen Kommentare hinzu. Das kann MS Word, Software zur Unterstützung von TeX, LaTeX usw. bedeuten.

Das ist es. Die Vorteile sind eindeutig Einfachheit (nichts Neues zu lernen) und Flexibilität (fügen Sie das hinzu, was Sie möchten, so wie Sie es möchten).

Dies ist keine automatisierte Lösung. Aber auch automatisierte Lösungen hängen davon ab, dass Informationen in den Diagrammen und Ihren Kommentaren eingespeist werden. Was ist das anders?


2
Ich denke, Sie verkaufen es. Wenn Sie anstelle des Einfügens einen Link zu einer Datei hinzufügen (wie in Word-Latex usw.), werden die Dokumente beim Aktualisieren der Diagramme aktualisiert - also "automatisiert". Außerdem gefällt mir die Tatsache, dass man die Erzeugung der Diagramme vom Layout trennen kann (z. B. 3 Diagramme auf einer Seite gegen 2 x 2-Layout
anpassen

3

Ich empfehle Jupyter Notebook , mit dem Sie Dokumente erstellen können, die eingestreute Codeblöcke, Diagramme und Notizen / Dokumentationen enthalten. Das Dokument kann Markdown und Latex enthalten, die automatisch gerendert werden (ähnlich wie beim Schreiben auf CrossValidated). Wenn Sie einen Codeblock ausführen, werden alle von ihm generierten Textausgaben und Diagramme inline zum Dokument hinzugefügt. Sie können einen Codeblock ändern und erneut ausführen, um die Ausgabe / Diagramme zu aktualisieren. Dies ist gut geeignet, um Dinge interaktiv zu testen (z. B. Code / Parameter anpassen, um zu sehen, was passiert). Ich denke, es ist einfacher, als Zahlen zu exportieren und in ein traditionelles, statisches Dokument einzufügen, insbesondere wenn Sie etwas ändern. Sie können ein Notizbuch als PDF usw. exportieren, um eine statische Kopie zu erhalten.

Es ist Open Source und funktioniert mit Python, R und anderen Sprachen. Die Benutzeroberfläche ist browserbasiert, daher plattformübergreifend und einfach zu verwendende Notebooks. Sie können das Backend auf Ihrem eigenen Computer ausführen oder Notebooks auf einer Website hosten, damit Sie / andere sie von überall aus bearbeiten / anzeigen / ausführen können (der Code wird auf dem Server ausgeführt). Anscheinend gibt es eine Möglichkeit, das Notebook als Frontend für einen Computercluster für parallele Berechnungen zu konfigurieren.


Ich habe das schon mehrfach versucht, bin aber nicht wirklich davon überzeugt, dass es sehr gut funktioniert hat: Die Kombination von Code / Grafiken / Dokumentation bei gleichzeitiger Sicherstellung, dass alles lesbar ist, scheint in der Praxis sehr schwierig zu sein. Ich habe Präsentationen gesehen, bei denen dies geschehen ist, aber vermutet, dass der Aufwand beträchtlich ist (wie bei jeder Präsentation). Mein Punkt bei EDA ist, dass Sie viele Grafiken usw. erstellen - zu viele, um sie zu präsentieren ... in einer Präsentation zeigen Sie das Beste. Würde Beispiele begrüßen, die meinem Eindruck widersprechen.
Seanv507

2

Ich neige dazu, immer mehr Analysen R notebooksinnerhalb von RStudio durchzuführen. Auf diese Weise kann ich Code, Anmerkungen und Grafiken an einem Ort zusammenfassen und muss nicht ständig PDFs erstellen - das spart Zeit. Sie schreiben Text und Code in einen Editor und durch Klicken auf eine Schaltfläche wird der Code ausgeführt (und das Diagramm gezeichnet). So bleiben Text, Code und Plot ordentlich zusammen. Es ist auch sehr einfach, mit wenigen Mausklicks in HTML oder PDF zu konvertieren. Ich weiß nicht, wie gut das mit Python funktioniert, da ich meistens R benutze.


2

Es hört sich so an, als ob Sie eine Art literarische Programmierung wollen . Rbietet Sweave und Knitr diese Schnittstelle zu LaTeX . Es gibt andere Optionen für verschiedene Arten von Ausgabeformaten, z. B. ODFweave für bearbeitbare Dokumente (wie Word-Dokumente) und RMarkdown , die mehrere Typen ausgeben können (wie HTML zusätzlich zu den oben genannten). Andere Statistiksoftware weisen üblicherweise analoge Merkmale auf.

(Die Verwendung dieser Dateien erfordert einige Vorarbeiten. Ich mache normalerweise einmalige Projekte anstelle längerfristiger Projekte, für die regelmäßige und ähnliche Berichte erforderlich sind. Daher verwende ich normalerweise die Methode von @ NickCox zum Speichern oder Kopieren in eine Datei und Kommentare dazu schreiben.)


1

In R: Manchmal füge ich einem PDF einen zusätzlichen Plot mit einigen grundlegenden Informationen hinzu. Dies ist am nützlichsten, wenn die Anmerkungen kurz sind und sich auf die Plotdaten beziehen, sodass Sie pastezusätzliche Informationen erhalten können. Zum Beispiel:

pdf("cars-plots.pdf")
plot(cars)
plot.new()
legend("center", bty = "n", legend =
           paste0("Data: 'cars'\n",
                  "cor = ", round(cor(cars)[1, 2], 2), "\n",
                  "N = ", nrow(cars), "\n",
                  Sys.Date()))
dev.off()

Wenn Sie längere Anmerkungen haben, kann alternativ die Erstellung eines Berichts mit R Markdown eine Lösung sein.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.