Als «eda» getaggte Fragen

EDA steht für "Exploratory Data Analysis". Entwickelt von Tukey im Gegensatz zu Confirmatory Data Analysis oder CDA (dem formalen Testen von Hypothesen). EDA befasst sich in der Regel mit der numerischen und grafischen Beschreibung von Daten, um das Verständnis der Daten zu erleichtern und neue Erkenntnisse zu gewinnen.

2
Gibt es Unterschiede in der bayesianischen und der frequentistischen Herangehensweise an EDA?
Ganz einfach gesagt: Gibt es Unterschiede in den Bayesianischen und Frequentistischen Ansätzen zur exploratorischen Datenanalyse? Ich kenne keine inhärenten Verzerrungen in EDA-Methoden, da ein Histogramm ein Histogramm ist, ein Streudiagramm ein Streudiagramm ist usw., und ich habe auch keine Beispiele für Unterschiede in der Darstellung oder Vermittlung von EDA gefunden …


5
Ist es besser, eine explorative Datenanalyse nur für den Trainingsdatensatz durchzuführen?
Ich mache eine explorative Datenanalyse (EDA) für einen Datensatz. Dann werde ich einige Features auswählen, um eine abhängige Variable vorherzusagen. Die Frage ist: Soll ich die EDA nur für meinen Trainingsdatensatz durchführen? Oder sollte ich die Trainings- und Testdatensätze zusammenfügen und dann die EDA auf beiden durchführen und die Funktionen …


4
Beste Möglichkeiten zum Aggregieren und Analysieren von Daten
Ich habe gerade erst angefangen, mir Maschinelles Lernen und Datenanalyse beizubringen, und stoße auf eine Mauer, in der es darum geht, große Datenmengen zu erstellen und abzufragen. Ich möchte Daten, die ich in meinem beruflichen und privaten Leben gesammelt habe, aufgreifen und analysieren, bin mir jedoch nicht sicher, wie ich …


2
Wenn mein Histogramm eine glockenförmige Kurve zeigt, kann ich sagen, dass meine Daten normal verteilt sind?
Ich habe ein Histogramm für das Alter der Befragten erstellt und es geschafft, eine sehr schöne glockenförmige Kurve zu erhalten, aus der ich den Schluss gezogen habe, dass die Verteilung normal ist. Dann habe ich den Normalitätstest in SPSS mit n = 169 durchgeführt. Der p- Wert (Sig.) Des Kolmogorov-Smirnov-Tests …

1
Interpretieren von gekerbten Boxplots
Während ich eine EDA durchführte, entschied ich mich, ein Box-Diagramm zu verwenden, um den Unterschied zwischen zwei Ebenen eines Faktors zu veranschaulichen. Die Art und Weise, wie ggplot das Box-Diagramm renderte, war zufriedenstellend, aber leicht vereinfacht (erstes Diagramm unten). Während ich die Eigenschaften von Boxplots untersuchte, begann ich mit Kerben …

2
Was ist mit "Lassen Sie die Daten für sich selbst sprechen" gemeint?
Beim Lesen des folgenden Papiers bin ich auf folgende Aussage gestoßen: Wie bereits erwähnt, wird es häufig ohne Bezugnahme auf probabilistische Modelle präsentiert, in Übereinstimmung mit Benzecris [1973] Idee, "die Daten für sich selbst sprechen zu lassen". (Zitat von JP Benzécri. L'analyse des données. Band II: L'analyse des korrespondenzen. Dunod, …
10 eda  quotation 

3
Erster kurzer Blick auf einen Datensatz
Bitte verzeihen Sie meine Unwissenheit, aber ... Ich befinde mich immer wieder in einer Situation, in der ich mit einer Reihe neuer Daten konfrontiert bin, die ich gefunden habe. Diese Daten sehen normalerweise ungefähr so ​​aus: Date Number1 Number2 Category1 Category2 20120125 11 101 Dog Brown 20120126 21 90 Cat …


4
Warum bedeutet die Tatsache, dass 1 Median niedriger als ein anderer Median ist, nicht, dass die meisten in Gruppe 1 kleiner sind als die meisten in Gruppe 2?
Ich glaubte, dass die folgenden Boxplots als "die meisten Männer sind schneller als die meisten Frauen" (in diesem Datensatz) interpretiert werden könnten, hauptsächlich weil die mittlere Männerzeit niedriger war als die mittlere Frauenzeit. Aber der EdX-Kurs zu R und Statistik- Quiz hat mir gesagt, dass das falsch ist. Bitte helfen …

2
Parametrisches, semiparametrisches und nichtparametrisches Bootstrapping für gemischte Modelle
Die folgenden Transplantate stammen aus diesem Artikel . Ich bin ein Neuling im Bootstrap und versuche, das parametrische, semiparametrische und nichtparametrische Bootstrapping-Bootstrapping für ein lineares gemischtes Modell mit R bootPaket zu implementieren. R-Code Hier ist mein RCode: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

3
Richtlinien für die Entdeckung neuen Wissens in Daten
Ich plane etwas, um mich selbst oder jemand anderen zu verdeutlichen. Normalerweise startet eine Frage diesen Prozess, und oft hofft die fragende Person auf eine bestimmte Antwort. Wie kann ich weniger voreingenommen interessante Dinge über die Daten erfahren? Im Moment folge ich ungefähr dieser Methode: Zusammengefasste Statistiken. Streifendiagramm. Streudiagramm. Vielleicht …

2
Sind Datentransformationen für nicht normale Daten für eine explorative Faktoranalyse erforderlich, wenn die Extraktionsmethode des Hauptachsenfaktors verwendet wird?
Ich entwickle einen Fragebogen, um vier Faktoren zu messen, die Spiritualität ausmachen, und ich möchte die folgende Frage stellen: Sind Datentransformationen für nicht normale Daten für eine explorative Faktoranalyse erforderlich, wenn die Extraktionsmethode des Hauptachsenfaktors verwendet wird? Ich habe gestern das Screening meiner Daten beendet und festgestellt, dass 3 von …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.