Hat jemand Kenntnisse über Workflows für die Datenanalyse im Zusammenhang mit dem Verfassen von benutzerdefinierten Berichten? Der Anwendungsfall ist im Grunde folgender:
Der Kunde gibt einen Bericht in Auftrag, der Datenanalysen verwendet, z. B. eine Bevölkerungsschätzung und zugehörige Karten für ein Wasserviertel.
Der Analyst lädt einige Daten herunter, mungiert die Daten und speichert das Ergebnis (z. B. Hinzufügen einer Spalte für die Bevölkerung pro Einheit oder Unterteilen der Daten basierend auf Bezirksgrenzen).
Die Analystin analysiert die in (2) erstellten Daten, nähert sich ihrem Ziel, sieht jedoch, dass mehr Daten benötigt werden, und geht daher auf (1) zurück.
Wiederholen Sie den Vorgang, bis die Tabellen und Grafiken der Qualitätssicherung / Qualitätskontrolle entsprechen und den Kunden zufrieden stellen.
Schreiben Sie einen Bericht mit Tabellen und Grafiken.
Nächstes Jahr kommt der zufriedene Kunde zurück und möchte ein Update. Dies sollte so einfach sein wie das Aktualisieren der vorgelagerten Daten durch einen neuen Download (z. B. das Abrufen der Baugenehmigungen aus dem letzten Jahr) und das Drücken der Schaltfläche "NEU BERECHNEN", sofern sich die Spezifikationen nicht ändern.
Im Moment starte ich einfach ein Verzeichnis und ad-hoc es so gut ich kann. Ich hätte gerne einen systematischeren Ansatz, also hoffe ich, dass jemand dies herausgefunden hat ... Ich verwende eine Mischung aus Tabellenkalkulations-, SQL-, ARCGIS-, R- und Unix-Tools.
Vielen Dank!
PS:
Im Folgenden finden Sie ein grundlegendes Makefile, das nach Abhängigkeiten von verschiedenen Zwischendatensätzen (mit .RData
Suffix) und Skripten ( .R
Suffix) sucht. Make verwendet Zeitstempel, um Abhängigkeiten zu überprüfen. Wenn Sie touch ss07por.csv
dies tun , wird festgestellt, dass diese Datei neuer ist als alle davon abhängigen Dateien / Ziele, und die angegebenen Skripts ausführen, um sie entsprechend zu aktualisieren. Dies ist noch in Arbeit, einschließlich eines Schritts zum Einfügen in die SQL-Datenbank und eines Schritts zum Erstellen einer Vorlagensprache wie sweave. Beachten Sie, dass Make in seiner Syntax auf Registerkarten basiert. Lesen Sie daher das Handbuch, bevor Sie ausschneiden und einfügen. Viel Spaß und Feedback geben!
http://www.gnu.org/software/make/manual/html_node/index.html#Top
R = / home / wsprague / R-2.9.2 / bin / R. persondata.RData: ImportData.R ../../DATA/ss07por.csv Functions.R $ R --slave -f ImportData.R persondata.Munged.RData: MungeData.R persondata.RData Functions.R $ R --slave -f MungeData.R report.txt: TabulateAndGraph.R persondata.Munged.RData Functions.R $ R --slave -f TabulateAndGraph.R> report.txt