Was ist ein praktisch guter Datenanalyseprozess?


15

Ich möchte den Analyseprozess kennenlernen oder Referenzen darüber haben, den die meisten statistischen Datenanalysten für jedes Datenanalyseprojekt durchlaufen.

Wenn ich eine "Liste" erstelle, um das Datenanalyseprojekt abzuschließen, muss ein Analyst:

  1. Sammeln Sie zuerst die Anforderungen für das Projekt.
  2. Planen / Gestalten Sie seine Datenanalyse auf der Grundlage dieser Anforderungen
  3. Daten tatsächlich vorverarbeiten,
  4. Ausführen der Datenanalyse und
  5. Verfassen eines Berichts auf der Grundlage seiner Analyseergebnisse.

Bei dieser Frage interessieren mich weitere Details zu Schritt 2. Ich verstehe jedoch, dass dies praktisch nicht eindeutig ist, da der Analyst möglicherweise seinen Plan oder sein Design entsprechend der Datenanalyse-Ausgabe ändern muss. Gibt es einen Hinweis zu diesem Thema?

Antworten:


17

Mein bevorzugter "Plan" oder "Liste" ist Scott Emersons Dokument " Organizing Your Approach to a Data Analysis" .

Hinweis: Die letzten beiden Seiten befinden sich unter der Überschrift "Allgemeine Anforderungen für die Doktorprüfung". Die dort gegebenen Ratschläge verallgemeinern jedoch die Bearbeitung von Analyseproblemen.


Lieben Sie jeden Teil des Dokuments. Danke für den wertvollen Hinweis.
Tae-Sung Shin

5

Ich fand, dass der Workflow der Datenanalyse mit Stata ein gutes Buch ist, insbesondere (aber nicht nur) als Stata-Benutzer. Ich fand viel, womit ich nicht einverstanden war, aber selbst das half zu klären, warum ich bestimmte Dinge tue.


4
+1, aber Vorbehalt : Dieses Buch ist nur von Nutzen, wenn Sie ein Stata-Benutzer sind. Ich benutze keine Stata (in der Tat habe ich nie). Andererseits mag ich Long, also habe ich das aus der Bibliothek ausgecheckt. Ich bin mir sicher, dass es für jeden eine Menge guter Informationen gibt, aber es ist so eng mit der Verwendung von Stata verknüpft, dass es unmöglich ist, die allgemeinen Domain-Informationen zu extrahieren.
gung - Reinstate Monica

2

CRISP-DM , das von der Firma SPSS (die jetzt zu IBM gehört) geprägt wurde, ist eine Abkürzung für den Data-Mining-Prozess, die mit der Abkürzung für "Datenanalyse" identisch ist. SAS hat einen ähnlichen Prozess namens SEMMA .

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.