Als «data-transformation» getaggte Fragen

Mathematische, oft nichtlineare Reexpression von Datenwerten. Daten werden häufig transformiert, um entweder die Annahmen eines statistischen Modells zu erfüllen oder um die Ergebnisse einer Analyse besser interpretierbar zu machen.

4
Box Cox Transformationen zur Regression
Ich versuche, ein lineares Modell mit nur einem Prädiktor (z. B. (x, y)) an einige Daten anzupassen. Die Daten sind so, dass für kleine Werte von x die y-Werte eine enge Anpassung an eine gerade Linie ergeben. Wenn jedoch die x-Werte zunehmen, werden die y-Werte flüchtiger. Hier ist ein Beispiel …

2
Parametrisches, semiparametrisches und nichtparametrisches Bootstrapping für gemischte Modelle
Die folgenden Transplantate stammen aus diesem Artikel . Ich bin ein Neuling im Bootstrap und versuche, das parametrische, semiparametrische und nichtparametrische Bootstrapping-Bootstrapping für ein lineares gemischtes Modell mit R bootPaket zu implementieren. R-Code Hier ist mein RCode: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

1
Wie kann man die Gewinner einer regionalen Wissenschaftsmesse fair ermitteln?
Ich brauche Hilfe, um herauszufinden, wie die Gewinner unserer Wissenschaftsmesse richtig berechnet werden können. Ich möchte nicht, dass meine Unkenntnis von Statistik und Mathematik die Gewinnchancen eines Kindes beeinträchtigt. (viele Stipendien- und Aufstiegsvorteile stehen auf dem Spiel). Vielen Dank im Voraus für Ihre Hilfe. Zunächst ein kleiner Hintergrund darüber, wie …

1
Wie kombiniere ich die Prognosen, wenn die Antwortvariable in Prognosemodellen unterschiedlich war?
Einführung In der Prognosekombination basiert eine der beliebtesten Lösungen auf der Anwendung einiger Informationskriterien. Wenn man zum Beispiel das für das Modell geschätzte Akaike-Kriterium , könnte man die Differenzen von von und dann könnte RP_j = e ^ {(AIC ^ * - AIC_j) / 2} interpretiert werden als die relative …

3
Lineare Regressionseffektgrößen bei Verwendung transformierter Variablen
Bei der Durchführung einer linearen Regression ist es häufig nützlich, eine Transformation wie eine logarithmische Transformation für die abhängige Variable durchzuführen, um eine bessere Normalverteilungskonformation zu erzielen. Oft ist es auch nützlich, Betas anhand der Regression zu untersuchen, um die Effektgröße / tatsächliche Relevanz der Ergebnisse besser beurteilen zu können. …


7
Normalverteilung und monotone Transformationen
Ich habe gehört, dass viele Mengen, die in der Natur vorkommen, normal verteilt sind. Dies wird normalerweise mit dem zentralen Grenzwertsatz gerechtfertigt, der besagt, dass Sie eine Normalverteilung erhalten, wenn Sie eine große Anzahl von iid-Zufallsvariablen mitteln. So kann beispielsweise ein Merkmal, das durch die additive Wirkung einer großen Anzahl …






3
Ein konkretes Beispiel ist die Durchführung einer SVD, um fehlende Werte zu unterstellen
Ich habe die großartigen Kommentare zum Umgang mit fehlenden Werten vor dem Anwenden von SVD gelesen, möchte aber anhand eines einfachen Beispiels wissen, wie dies funktioniert: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Wenn ich in der …
8 r  missing-data  data-imputation  svd  sampling  matlab  mcmc  importance-sampling  predictive-models  prediction  algorithms  graphical-model  graph-theory  r  regression  regression-coefficients  r-squared  r  regression  modeling  confounding  residuals  fitting  glmm  zero-inflation  overdispersion  optimization  curve-fitting  regression  time-series  order-statistics  bayesian  prior  uninformative-prior  probability  discrete-data  kolmogorov-smirnov  r  data-visualization  histogram  dimensionality-reduction  classification  clustering  accuracy  semi-supervised  labeling  state-space-models  t-test  biostatistics  paired-comparisons  paired-data  bioinformatics  regression  logistic  multiple-regression  mixed-model  random-effects-model  neural-networks  error-propagation  numerical-integration  time-series  missing-data  data-imputation  probability  self-study  combinatorics  survival  cox-model  statistical-significance  wilcoxon-mann-whitney  hypothesis-testing  distributions  normal-distribution  variance  t-distribution  probability  simulation  random-walk  diffusion  hypothesis-testing  z-test  hypothesis-testing  data-transformation  lognormal  r  regression  agreement-statistics  classification  svm  mixed-model  non-independent  observational-study  goodness-of-fit  residuals  confirmatory-factor  neural-networks  deep-learning 

3
Finden Sie die Verteilung und transformieren Sie sie in die Normalverteilung
Ich habe Daten, die beschreiben, wie oft ein Ereignis während einer Stunde stattfindet ("Anzahl pro Stunde", nph) und wie lange die Ereignisse dauern ("Dauer in Sekunden pro Stunde", dph). Dies sind die Originaldaten: nph <- c(2.50000000003638, 3.78947368414551, 1.51456310682008, 5.84686774940732, 4.58823529414907, 5.59999999993481, 5.06666666666667, 11.6470588233699, 1.99999999998209, NA, 4.46153846149851, 18, 1.05882352939726, 9.21739130425452, 27.8399999994814, …
8 normal-distribution  data-transformation  logistic  generalized-linear-model  ridge-regression  t-test  wilcoxon-signed-rank  paired-data  naive-bayes  distributions  logistic  goodness-of-fit  time-series  eviews  ecm  panel-data  reliability  psychometrics  validity  cronbachs-alpha  self-study  random-variable  expected-value  median  regression  self-study  multiple-regression  linear-model  forecasting  prediction-interval  normal-distribution  excel  bayesian  multivariate-analysis  modeling  predictive-models  canonical-correlation  rbm  time-series  machine-learning  neural-networks  fishers-exact  factorisation-theorem  svm  prediction  linear  reinforcement-learning  cdf  probability-inequalities  ecdf  time-series  kalman-filter  state-space-models  dynamic-regression  index-decomposition  sampling  stratification  cluster-sample  survey-sampling  distributions  maximum-likelihood  gamma-distribution 

2
Transformation Chi-Quadrat zur Normalverteilung
Die Beziehung zwischen der Standardnormalverteilung und der Chi-Quadrat-Verteilung ist bekannt. Ich habe mich allerdings gefragt, ob es eine Transformation gibt, die von einer zurück zu einer Standardnormalverteilung führen kann.χ2(1)χ2(1)\chi^2 (1) Es ist leicht zu erkennen, dass die Quadratwurzeltransformation nicht funktioniert, da ihr Bereich nur aus positiven Zahlen besteht. Ich glaube, …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.