Als «project-management» getaggte Fragen

Organisation von Computerarbeiten an * statistischen * Projekten; Verwendung für Fragen zur Datenspeicherung, Datenfreigabe, Code-Repositorys usw. Beachten Sie, dass Fragen zur Programmierung oder zu Statistiken nicht relevant sind.

7
Wie kann ein statistisches Analyseprojekt effizient verwaltet werden?
Wir hören oft von Projektmanagement- und Entwurfsmustern in der Informatik, aber seltener in der statistischen Analyse. Es scheint jedoch, dass ein entscheidender Schritt zur Gestaltung eines effektiven und dauerhaften statistischen Projekts darin besteht, die Dinge organisiert zu halten. Ich befürworte oft die Verwendung von R und eine konsistente Organisation von …

3
Warum gibt es einen Unterschied zwischen der manuellen Berechnung eines Konfidenzintervalls für eine logistische Regression von 95% und der Verwendung der Funktion confint () in R?
Sehr geehrte Damen und Herren, mir ist etwas Merkwürdiges aufgefallen, das ich Ihnen nicht erklären kann. Zusammenfassend lässt sich sagen, dass der manuelle Ansatz zur Berechnung eines Konfidenzintervalls in einem logistischen Regressionsmodell und die R-Funktion confint()unterschiedliche Ergebnisse liefern. Ich habe die angewandte logistische Regression von Hosmer & Lemeshow (2. Auflage) …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 


6
Wie kann die langfristige Reproduzierbarkeit der Forschung erhöht werden (insbesondere mit R und Sweave)?
Kontext: Als Antwort auf eine frühere Frage zur reproduzierbaren Forschung schrieb Jake Ein Problem, das wir beim Erstellen unseres JASA-Archivs festgestellt haben, war, dass sich Versionen und Standardeinstellungen von CRAN-Paketen geändert haben. In diesem Archiv sind also auch die Versionen der von uns verwendeten Pakete enthalten. Das vignettenbasierte System wird …

1
Berechnung der Wiederholbarkeit von Effekten aus einem früheren Modell
Ich bin gerade auf diese Arbeit gestoßen , in der beschrieben wird, wie die Wiederholbarkeit (auch bekannt als Zuverlässigkeit, auch bekannt als Intraclass-Korrelation) einer Messung über Mixed-Effects-Modellierung berechnet wird. Der R-Code wäre: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 



10
Strategie zum Bearbeiten von CSV-Dateien (Comma Separated Value)
Wenn ich an Datenanalyseprojekten arbeite, speichere ich Daten häufig in durch Kommas oder Tabulatoren getrennten (CSV, TSV) Datendateien. Während Daten häufig in ein dediziertes Datenbankverwaltungssystem gehören. Für viele meiner Anwendungen wäre dies eine Übertreibung. Ich kann CSV- und TSV-Dateien in Excel (oder vermutlich einem anderen Tabellenkalkulationsprogramm) bearbeiten. Das hat Vorteile: …


3
Was ist ein praktisch guter Datenanalyseprozess?
Ich möchte den Analyseprozess kennenlernen oder Referenzen darüber haben, den die meisten statistischen Datenanalysten für jedes Datenanalyseprojekt durchlaufen. Wenn ich eine "Liste" erstelle, um das Datenanalyseprojekt abzuschließen, muss ein Analyst: Sammeln Sie zuerst die Anforderungen für das Projekt. Planen / Gestalten Sie seine Datenanalyse auf der Grundlage dieser Anforderungen Daten …

3
Variablennamen in einem Dataset verbessern
Gute Variablennamen sind: a) kurz / leicht zu tippen, b) leicht zu merken, c) verständlich / kommunikativ. Vergesse ich etwas? Konsistenz ist etwas zu suchen. Ich würde sagen, dass konsistente Namenskonventionen zu den oben genannten Eigenschaften beitragen. Konsistenz trägt zu (b) leichtem Rückruf und (c) Verständlichkeit bei, obwohl andere Faktoren …



Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.