Als «normality-assumption» getaggte Fragen

Viele statistische Methoden gehen davon aus, dass die Daten normal verteilt sind. Verwenden Sie dieses Tag für Fragen zur Annahme und zum Testen der Normalität oder zur Normalität als * Eigenschaft *. Verwenden Sie [Normalverteilung] für Fragen zur Normalverteilung an sich.


1
Frage zur Normalitätsannahme des t-Tests
Bei T-Tests wird nach den meisten Texten davon ausgegangen, dass die Bevölkerungsdaten normal verteilt sind. Ich verstehe nicht, warum das so ist. Erfordert ein T-Test nicht nur, dass die Stichprobenverteilung der Stichprobenmittel normal verteilt ist und nicht die Population? Wenn der T-Test letztendlich nur eine Normalität in der Stichprobenverteilung erfordert, …

2
Warum ist eine Pearson-Rangkorrelation trotz Normalitätsannahme gültig?
Ich lese gerade über Annahmen für Pearson-Korrelationen. Eine wichtige Annahme für den folgenden t-Test scheint zu sein, dass beide Variablen aus Normalverteilungen stammen; Wenn dies nicht der Fall ist, wird die Verwendung alternativer Maßnahmen wie des Spearman Rho empfohlen. Die Spearman-Korrelation wird wie die Pearson-Korrelation berechnet, wobei nur die Ränge …

3
Bewertung der Leistung eines Normalitätstests (in R)
Ich möchte die Genauigkeit von Normalitätstests über verschiedene Stichprobengrößen in R bewerten (mir ist klar, dass Normalitätstests irreführend sein können ). Um zum Beispiel den Shapiro-Wilk-Test zu betrachten, führe ich die folgende Simulation durch (sowie das Aufzeichnen der Ergebnisse) und würde erwarten, dass mit zunehmender Stichprobengröße die Wahrscheinlichkeit der Zurückweisung …

2
Berechnen Sie die ROC-Kurve für Daten
Ich habe also 16 Studien, in denen ich versuche, eine Person anhand eines biometrischen Merkmals mithilfe von Hamming Distance zu authentifizieren. Mein Schwellenwert ist auf 3,5 eingestellt. Meine Daten sind unten und nur Versuch 1 ist ein wahres Positiv: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 …
9 mathematical-statistics  roc  classification  cross-validation  pac-learning  r  anova  survival  hazard  machine-learning  data-mining  hypothesis-testing  regression  random-variable  non-independent  normal-distribution  approximation  central-limit-theorem  interpolation  splines  distributions  kernel-smoothing  r  data-visualization  ggplot2  distributions  binomial  random-variable  poisson-distribution  simulation  kalman-filter  regression  lasso  regularization  lme4-nlme  model-selection  aic  r  mcmc  dlm  particle-filter  r  panel-data  multilevel-analysis  model-selection  entropy  graphical-model  r  distributions  quantiles  qq-plot  svm  matlab  regression  lasso  regularization  entropy  inference  r  distributions  dataset  algorithms  matrix-decomposition  regression  modeling  interaction  regularization  expected-value  exponential  gamma-distribution  mcmc  gibbs  probability  self-study  normality-assumption  naive-bayes  bayes-optimal-classifier  standard-deviation  classification  optimization  control-chart  engineering-statistics  regression  lasso  regularization  regression  references  lasso  regularization  elastic-net  r  distributions  aggregation  clustering  algorithms  regression  correlation  modeling  distributions  time-series  standard-deviation  goodness-of-fit  hypothesis-testing  statistical-significance  sample  binary-data  estimation  random-variable  interpolation  distributions  probability  chi-squared  predictor  outliers  regression  modeling  interaction 

7
Normalverteilung und monotone Transformationen
Ich habe gehört, dass viele Mengen, die in der Natur vorkommen, normal verteilt sind. Dies wird normalerweise mit dem zentralen Grenzwertsatz gerechtfertigt, der besagt, dass Sie eine Normalverteilung erhalten, wenn Sie eine große Anzahl von iid-Zufallsvariablen mitteln. So kann beispielsweise ein Merkmal, das durch die additive Wirkung einer großen Anzahl …


4
Analyse des Fehlers des Bayes-Klassifikators analytisch
Wenn zwei Klassen und eine Normalverteilung mit bekannten Parametern haben ( , als Mittel und , sind ihre Kovarianzen), wie können wir den Fehler des Bayes-Klassifikators für sie theoretisch berechnen?w1w1w_1w2w2w_2M.1M1M_1Σ 1 Σ 2M.2M2M_2Σ1Σ1\Sigma_1Σ2Σ2\Sigma_2 Angenommen, die Variablen befinden sich im N-dimensionalen Raum. Hinweis: Eine Kopie dieser Frage ist auch unter https://math.stackexchange.com/q/11891/4051 …

1
Wie robust ist der Maximum-Likelihood-Schätzer bei der Modellierung von Strukturgleichungen gegenüber einem Mangel an multivariater Normalität?
In einem Strukturgleichungsmodell wird häufig der ML-Schätzer verwendet. Kann ML verwendet werden, wenn die Variablen nicht multivariat normal sind? Oft sind die Indikatoren, mit denen Sie arbeiten können, nicht multivariat normal. Ich bin mir nicht sicher, wie ich in diesem Fall vorgehen soll.

1
Warum sollte ich einen Bootstrap durchführen wollen, wenn ich einen unabhängigen Beispiel-T-Test berechne? (wie man einen Bootstrap-T-Test rechtfertigt, interpretiert und meldet)
Angenommen, ich habe zwei Bedingungen und meine Stichprobengröße für die beiden Bedingungen ist extrem niedrig. Nehmen wir an, ich habe nur 14 Beobachtungen in der ersten Bedingung und 11 in der anderen. Ich möchte den t-Test verwenden, um zu testen, ob sich die mittleren Unterschiede signifikant voneinander unterscheiden. Erstens bin …

1
Lineare Diskriminanzanalyse und nicht normalverteilte Daten
Wenn ich das richtig verstehe, setzt eine lineare Diskriminanzanalyse (LDA) normalverteilte Daten, unabhängige Merkmale und identische Kovarianzen für jede Klasse für das Optimalitätskriterium voraus. Ist es nicht schon eine Verletzung, da der Mittelwert und die Varianz aus den Trainingsdaten geschätzt werden? Ich fand ein Zitat in einem Artikel (Li, Tao, …

2
Warum würde ein statistisches Modell bei einem riesigen Datensatz überanpassen?
Für mein aktuelles Projekt muss ich möglicherweise ein Modell erstellen, um das Verhalten einer bestimmten Personengruppe vorherzusagen. Der Trainingsdatensatz enthält nur 6 Variablen (ID dient nur zu Identifikationszwecken): id, age, income, gender, job category, monthly spend in dem monthly spendist die Antwortvariable. Der Trainingsdatensatz enthält jedoch ungefähr 3 Millionen Zeilen, …
8 modeling  large-data  overfitting  clustering  algorithms  error  spatial  r  regression  predictive-models  linear-model  average  measurement-error  weighted-mean  error-propagation  python  standard-error  weighted-regression  hypothesis-testing  time-series  machine-learning  self-study  arima  regression  correlation  anova  statistical-significance  excel  r  regression  distributions  statistical-significance  contingency-tables  regression  optimization  measurement-error  loss-functions  image-processing  java  panel-data  probability  conditional-probability  r  lme4-nlme  model-comparison  time-series  probability  probability  conditional-probability  logistic  multiple-regression  model-selection  r  regression  model-based-clustering  svm  feature-selection  feature-construction  time-series  forecasting  stationarity  r  distributions  bootstrap  r  distributions  estimation  maximum-likelihood  garch  references  probability  conditional-probability  regression  logistic  regression-coefficients  model-comparison  confidence-interval  r  regression  r  generalized-linear-model  outliers  robust  regression  classification  categorical-data  r  association-rules  machine-learning  distributions  posterior  likelihood  r  hypothesis-testing  normality-assumption  missing-data  convergence  expectation-maximization  regression  self-study  categorical-data  regression  simulation  regression  self-study  self-study  gamma-distribution  modeling  microarray  synthetic-data 


1
Bootstrap-Parameter- und Anpassungsschätzungen mit Nichtnormalität für Strukturgleichungsmodelle
Kontext: Im Rahmen der Modellierung von Strukturgleichungen habe ich nach dem Mardia-Test eine Nichtnormalität, aber univariate Indizes für Schiefe und Kurtosis liegen unter 2,0. Fragen: Sollten Parameterschätzungen (Koeffizientenschätzungen) mithilfe von Bootstrapping (1000 Replikate) mit vorspannungskorrigierten Methoden bewertet werden? Sollte anstelle des traditionellen Chi-Quadrat-Tests die Bootstrap-Version von Bollen-Stine verwendet werden?

1
Ist der Shapiro Wilk Test W eine Effektgröße?
Ich möchte vermeiden, Normalitätstests zu missbrauchen, bei denen eine ausreichend große Stichprobe eine leichte Nichtnormalität hervorhebt. Ich möchte sagen können, dass eine Verteilung "normal genug" ist. Wenn die Population nicht normal ist, tendiert der p-Wert für den Shapiro-Wilk-Test mit zunehmender Stichprobengröße gegen 0. Der p-Wert ist nicht hilfreich bei der …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.