Als «dataset» getaggte Fragen

Anfragen nach Datensätzen sind auf dieser Site nicht zum Thema. Verwenden Sie dieses Tag für Fragen zum Erstellen, Verarbeiten oder Verwalten von Datasets.


25
Auffinden frei verfügbarer Datenproben
Ich habe an einer neuen Methode zum Analysieren und Analysieren von Datensätzen gearbeitet, um Untergruppen einer Population zu identifizieren und zu isolieren, ohne vorher die Merkmale einer Untergruppe zu kennen. Während die Methode mit Stichproben künstlicher Daten (dh Datensätzen, die speziell zum Identifizieren und Trennen von Teilmengen der Bevölkerung erstellt …

6
Tests zur Überprüfung grundlegender Daten
In meiner beruflichen Tätigkeit arbeite ich oft mit Datensätzen anderer Personen, Nicht-Experten bringen mir klinische Daten und ich helfe ihnen, diese zusammenzufassen und statistische Tests durchzuführen. Das Problem, das ich habe, ist, dass die Datensätze, die ich mitbringe, fast immer mit Tippfehlern, Inkonsistenzen und allen möglichen anderen Problemen durchsetzt sind. …

8
Wie können Daten simuliert werden, die bestimmte Bedingungen erfüllen, z. B. einen bestimmten Mittelwert und eine bestimmte Standardabweichung?
Diese Frage ist durch meine Frage zur Metaanalyse motiviert . Ich stelle mir jedoch vor, dass dies auch in Lehrkontexten nützlich ist, in denen Sie ein Dataset erstellen möchten, das genau einem vorhandenen veröffentlichten Dataset entspricht. Ich weiß, wie man zufällige Daten aus einer bestimmten Distribution generiert. Wenn ich also …

3
Daten-APIs / Feeds sind als Pakete in R verfügbar
EDIT: Die Web - Technologien und Services CRAN Aufgabenansicht enthält eine viel umfassendere Liste der Datenquellen und APIs in R. Sie können eine Pull - Anforderung auf Github einreichen , wenn Sie ein Paket zur Aufgabe Ansicht hinzufügen möchten. Ich erstelle eine Liste der verschiedenen Datenfeeds, die bereits in R …
53 r  references  dataset 

3
Interpretation des log transformierten Prädiktors und / oder der Antwort
Ich frage mich, ob es einen Unterschied in der Interpretation macht, ob nur die abhängigen, sowohl die abhängigen als auch die unabhängigen Variablen oder nur die unabhängigen Variablen log-transformiert werden. Betrachten Sie den Fall von log(DV) = Intercept + B1*IV + Error Ich kann die IV als prozentuale Erhöhung interpretieren, …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

9
Winzige (echte) Datensätze für Beispiele im Unterricht?
Beim Unterrichten einer Einführungsklasse erfinden die mir bekannten Lehrer in der Regel einige Zahlen und eine Geschichte, um die Methode zu veranschaulichen, die sie unterrichten. Ich würde es vorziehen, eine echte Geschichte mit reellen Zahlen zu erzählen. Diese Geschichten müssen sich jedoch auf einen sehr kleinen Datensatz beziehen, der manuelle …

8
Wie bringe ich Leute dazu, sich besser um Daten zu kümmern?
An meinem Arbeitsplatz arbeiten Mitarbeiter unterschiedlichster Disziplinen. Daher generieren wir Daten in vielen verschiedenen Formen. Folglich hat jedes Team ein eigenes System zum Speichern von Daten entwickelt. Einige verwenden Access- oder SQL-Datenbanken. Einige Teams sind (zu meinem Entsetzen) fast ausschließlich auf Excel-Tabellen angewiesen. Oft ändern sich die Datenformate von Projekt …



5
Freier Datensatz für sehr hohe dimensionale Klassifizierung [geschlossen]
Was ist der frei verfügbare Datensatz zur Klassifizierung mit mehr als 1000 Merkmalen (oder Stichprobenpunkten, wenn er Kurven enthält)? Es gibt bereits ein Community-Wiki zu freien Datensätzen: Auffinden frei verfügbarer Datenproben Aber hier wäre es schön, eine fokussiertere Liste zu haben, die bequemer verwendet werden kann. Außerdem schlage ich die …



2
Durchführen eines statistischen Tests nach der Datenvisualisierung - Datenbaggerung?
Ich werde diese Frage anhand eines Beispiels vorschlagen. Angenommen, ich habe einen Datensatz, z. B. den Preisdatensatz für Wohnimmobilien in Boston, in dem ich kontinuierliche und kategoriale Variablen habe. Hier haben wir eine "Qualitäts" -Variable von 1 bis 10 und den Verkaufspreis. Ich kann die Daten in Häuser mit "niedriger", …

3
Visualisierung der Schnittpunkte vieler Mengen
Gibt es ein Visualisierungsmodell, mit dem die Überschneidung vieler Mengen dargestellt werden kann? Ich denke etwas wie Venn-Diagramme, aber das könnte sich irgendwie besser für eine größere Anzahl von Sätzen wie 10 oder mehr eignen. Wikipedia zeigt einige höher eingestellte Venn-Diagramme, aber auch die 4 eingestellten Diagramme sind sehr viel …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.