Als «normality-assumption» getaggte Fragen

Viele statistische Methoden gehen davon aus, dass die Daten normal verteilt sind. Verwenden Sie dieses Tag für Fragen zur Annahme und zum Testen der Normalität oder zur Normalität als * Eigenschaft *. Verwenden Sie [Normalverteilung] für Fragen zur Normalverteilung an sich.



4
Was sind die korrekten Werte für Präzision und Rückruf in Randfällen?
Präzision ist definiert als: p = true positives / (true positives + false positives) Ist es richtig, dass sich die Genauigkeit 1 nähert true positivesund false positivessich 0 nähert? Gleiche Frage zum Rückruf: r = true positives / (true positives + false negatives) Ich führe derzeit einen statistischen Test durch, …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

3
Beispiel einer Verteilung, bei der ein großer Stichprobenumfang für den zentralen Grenzwertsatz erforderlich ist
Einige Bücher geben an, dass eine Stichprobengröße von 30 oder höher erforderlich ist, damit der zentrale Grenzwertsatz eine gute Näherung für ergibt . X¯X¯\bar{X} Ich weiß, dass dies nicht für alle Distributionen ausreicht. Ich möchte einige Beispiele für Verteilungen sehen, bei denen selbst bei einer großen Stichprobengröße (möglicherweise 100 oder …

2
Wie kann man auf Unterschiede zwischen zwei Gruppen testen, wenn die Daten nicht normal verteilt sind?
Ich werde alle biologischen Details und Experimente eliminieren und nur das vorliegende Problem und das, was ich statistisch getan habe, zitieren. Ich würde gerne wissen, ob es richtig ist und wenn nicht, wie es weitergeht. Wenn die Daten (oder meine Erklärung) nicht klar genug sind, werde ich versuchen, sie durch …

4
Was ist die Basis für die Box- und Whisker-Plot-Definition eines Ausreißers?
Die Standarddefinition eines Ausreißers für einen Box- und Whisker-Plot liegt außerhalb des Bereichs , wobei und das erste Quartil und ist das dritte Quartil der Daten.{Q1−1.5IQR,Q3+1.5IQR}{Q.1-1.5ichQ.R,Q.3+1.5ichQ.R}\left\{Q1-1.5IQR,Q3+1.5IQR\right\}Q 1 Q 3IQR=Q3−Q1ichQ.R=Q.3-Q.1IQR= Q3-Q1Q1Q.1Q1Q3Q.3Q3 Was ist die Basis für diese Definition? Mit einer großen Anzahl von Punkten gibt sogar eine vollkommen normale Verteilung Ausreißer …



2
Wiederholte Messungen ANOVA: Wie lautet die Normalitätsannahme?
Ich bin verwirrt über die Normalitätsannahme bei ANOVA mit wiederholten Messungen. Insbesondere frage ich mich, welche Art von Normalität genau erfüllt sein sollte. Beim Lesen der Literatur und der Antworten zum Lebenslauf bin ich auf drei unterschiedliche Formulierungen dieser Annahme gestoßen. Die abhängige Variable innerhalb jeder (wiederholten) Bedingung sollte normal …

5
Wie entspricht die Stichprobenverteilung der Stichprobenmittelwerte dem Bevölkerungsmittelwert?
Ich versuche, Statistiken zu lernen, weil ich feststelle, dass sie so verbreitet sind, dass ich einige Dinge nicht lernen kann, wenn ich sie nicht richtig verstehe. Ich habe Probleme, diesen Begriff einer Stichprobenverteilung der Stichprobenmittel zu verstehen. Ich kann nicht verstehen, wie es einige Bücher und Websites erklärt haben. Ich …

1
R: Testnormalität der Residuen des linearen Modells - welche Residuen verwendet werden sollen
Ich möchte einen Shapiro-Wilk-W-Test und einen Kolmogorov-Smirnov-Test mit den Residuen eines linearen Modells durchführen, um die Normalität zu überprüfen. Ich habe mich nur gefragt, welche Residuen dafür verwendet werden sollten - die rohen Residuen, die Pearson-Residuen, studentisierte Residuen oder standardisierte Residuen? Für einen Shapiro-Wilk-W-Test scheinen die Ergebnisse für die rohen …

1
GBM-Paket vs. Caret mit GBM
Ich habe das Modell mit optimiert caret, aber dann das Modell mit dem gbmPaket erneut ausgeführt. Nach meinem Verständnis sollten das verwendete caretPaket gbmund die Ausgabe identisch sein. Nur ein kurzer Testlauf mit data(iris)zeigt jedoch eine Diskrepanz im Modell von etwa 5% unter Verwendung von RMSE und R ^ 2 …

2
Abweichung von der Normalitätsannahme in der ANOVA: Ist Kurtosis oder Skewness wichtiger?
Angewandte lineare statistische Modelle von Kutner et al. In Bezug auf Abweichungen von der Normalitätsannahme von ANOVA-Modellen heißt es: Die Kurtosis der Fehlerverteilung (entweder mehr oder weniger als eine Normalverteilung) ist im Hinblick auf die Auswirkungen auf Schlussfolgerungen wichtiger als die Schiefe der Verteilung . Ich bin ein bisschen verwirrt …


5
Wie führt man eine Imputation von Werten in einer sehr großen Anzahl von Datenpunkten durch?
Ich habe einen sehr großen Datensatz und es fehlen ungefähr 5% zufällige Werte. Diese Variablen sind miteinander korreliert. Der folgende Beispiel-R-Datensatz ist nur ein Spielzeugbeispiel mit Dummy-korrelierten Daten. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.