Als «eda» getaggte Fragen

EDA steht für "Exploratory Data Analysis". Entwickelt von Tukey im Gegensatz zu Confirmatory Data Analysis oder CDA (dem formalen Testen von Hypothesen). EDA befasst sich in der Regel mit der numerischen und grafischen Beschreibung von Daten, um das Verständnis der Daten zu erleichtern und neue Erkenntnisse zu gewinnen.

24
Faustregeln für „moderne“ Statistiken
Ich mag G van Belles Buch über statistische Faustregeln und in geringerem Maße allgemeine Fehler in der Statistik (und wie man sie vermeidet) von Phillip I Good und James W. Hardin. Sie adressieren häufige Fallstricke bei der Interpretation von Ergebnissen aus experimentellen Studien und Beobachtungsstudien und geben praktische Empfehlungen für …

6
Gibt es einen guten Grund, PCA anstelle von EFA zu verwenden? Kann PCA auch ein Ersatz für die Faktoranalyse sein?
In einigen Disziplinen wird PCA (Principal Component Analysis) systematisch und ohne Begründung verwendet, und PCA und EFA (Exploratory Factor Analysis) werden als Synonyme betrachtet. Ich habe daher kürzlich PCA verwendet, um die Ergebnisse einer Skalenvalidierungsstudie zu analysieren (21 Punkte auf einer 7-Punkte-Likert-Skala, die 3 Faktoren zu je 7 Punkten enthalten …



5
Daten "Erkundung" vs. Daten "Schnüffeln" / "Foltern"?
Oft bin ich auf informelle Warnungen vor "Datenschnüffeln" gestoßen (hier ist ein amüsantes Beispiel ), und ich glaube, ich habe eine intuitive Vorstellung davon, was das ungefähr bedeutet und warum es ein Problem sein könnte. Andererseits scheint die "explorative Datenanalyse" ein absolut seriöses Verfahren in der Statistik zu sein, zumindest …

4
Hat die Zeitschrift "Science" den "Garden of Forking Pathes Analysis" gebilligt?
Die Idee der adaptiven Datenanalyse ist, dass Sie Ihren Plan zur Analyse der Daten ändern, wenn Sie mehr darüber erfahren. Bei der explorativen Datenanalyse (EDA) ist dies im Allgemeinen eine gute Idee (Sie suchen häufig nach unvorhergesehenen Mustern in den Daten), bei einer bestätigenden Studie wird dies jedoch allgemein als …

2
Wie gehe ich mit explorativer Datenanalyse und Datenbaggerung in Studien mit kleinen Stichproben um?
Die explorative Datenanalyse (EDA) führt häufig dazu, dass andere "Spuren" untersucht werden, die nicht unbedingt zum ursprünglichen Satz von Hypothesen gehören. Bei Studien mit einer begrenzten Stichprobengröße und einer Vielzahl von Daten, die über verschiedene Fragebögen gesammelt wurden (soziodemografische Daten, neuropsychologische oder medizinische Maßstäbe - z. B. geistige oder körperliche …


6
Texas Sharpshooter Irrtum in der explorativen Datenanalyse
Ich habe diesen Artikel in Nature gelesen, in dem einige Irrtümer im Zusammenhang mit der Datenanalyse erläutert werden. Mir ist aufgefallen, dass der Texas Sharpshooter-Irrtum besonders schwer zu vermeiden war: Eine kognitive Falle, die während der Datenanalyse erwartet wird, zeigt die Fabel des texanischen Scharfschützen: Ein unfähiger Schütze, der ein …
23 eda  fallacy 

5
Was kann man nach Casella & Berger lernen?
Ich bin ein reiner Mathematik-Student mit wenig Hintergrundwissen in angewandter Mathematik. Seit dem letzten Herbst habe ich Unterricht in Casella & Bergers Buch genommen und hunderte (230+) Seiten mit Übungsproblemen in dem Buch abgeschlossen. Im Moment bin ich bei Kapitel 10. Da ich mich jedoch noch nicht mit Statistik befasst …


1
Was ist der "Hufeiseneffekt" und / oder der "Bogeneffekt" in der PCA / Korrespondenzanalyse?
In der ökologischen Statistik gibt es viele Techniken zur explorativen Datenanalyse mehrdimensionaler Daten. Dies nennt man "Ordinations" -Techniken. Viele sind die gleichen oder eng mit gängigen Techniken in anderen Bereichen der Statistik verwandt. Vielleicht wäre das prototypische Beispiel die Hauptkomponentenanalyse (PCA). Ökologen könnten PCA und verwandte Techniken verwenden, um „Farbverläufe“ …

8
Ideen für „Lab Notebook“ -Software?
Das ist also eine seltsame Passform, obwohl ich wirklich denke, dass es für jede Site eine seltsame Passform ist. Deshalb dachte ich, ich würde es hier unter meinen datenverdächtigen Brüdern versuchen. Ich bin aus der Biologie in die Epidemiologie und Biostatistik gekommen und habe immer noch Gewohnheiten aus diesem Bereich. …

2
Durchführung einer explorativen Datenanalyse zur Auswahl eines geeigneten Algorithmus für maschinelles Lernen
Wir studieren maschinelles Lernen durch maschinelles Lernen: Eine probabilistische Perspektive (Kevin Murphy). Während der Text die theoretische Grundlage jedes Algorithmus erklärt, sagt er selten, in welchem ​​Fall welcher Algorithmus besser ist, und wenn ja, sagt er nicht, wie man sagt, in welchem ​​Fall ich bin. Zum Beispiel wurde mir bei …

5
Eine gute Möglichkeit, viele Daten grafisch darzustellen
Ich arbeite an einem Projekt, das 14 Variablen und 345.000 Beobachtungen für Wohnungsdaten umfasst (z. B. Baujahr, Quadratmeterzahl, Verkaufspreis, Wohnbezirk usw.). Ich befasse mich mit dem Versuch, gute grafische Techniken und R-Bibliotheken zu finden, die nette Plott-Techniken enthalten. Ich sehe bereits, was in ggplot und lattice gut funktioniert, und ich …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.