Als «normal-distribution» getaggte Fragen

Die Normal- oder Gaußsche Verteilung hat eine Dichtefunktion, die eine symmetrische glockenförmige Kurve ist. Es ist eine der wichtigsten Verteilungen in der Statistik. Verwenden Sie das Tag [Normalität], um nach dem Testen der Normalität zu fragen.

1
Verständnis des Chi-Quadrat-Tests und der Chi-Quadrat-Verteilung
Ich versuche die Logik hinter dem Chi-Quadrat-Test zu verstehen. Der Chi-Quadrat-Test ist χ2=∑(obs−exp)2expχ2=∑(obs−exp)2exp\chi ^2 = \sum \frac{(obs-exp)^2}{exp} . wird dann mit einer Chi-Quadrat-Verteilung verglichen, um einen p-Wert herauszufinden, um die Nullhypothese abzulehnen oder nicht. : Die Beobachtungen stammen aus der Verteilung, mit der wir unsere erwarteten Werte erstellt haben. Zum …



3
Gibt es heute jemanden, der schneller ist als Usain Bolt?
EDIT: Ich interessiere mich mehr für die technischen Fragen und Methoden zur Bestimmung der Wahrscheinlichkeit eines "wahren" Maximums in einer bestimmten Population bei einer Stichprobenstatistik. Es gibt Probleme, die Wahrscheinlichkeit schnellerer Läufer als Mr. Bolt anhand von Rekordzeiten zu schätzen, die sowohl offensichtlich als auch subtil sind. Humor mich, indem …

2
QQ-Plot sieht normal aus, aber Shapiro-Wilk-Test sagt etwas anderes
In R habe ich eine Stichprobe von 348 Kennzahlen und möchte wissen, ob ich davon ausgehen kann, dass sie für zukünftige Tests normalverteilt sind. Nach einer weiteren Stack-Antwort betrachte ich im Wesentlichen die Dichtekurve und die QQ-Kurve mit: plot(density(Clinical$cancer_age)) qqnorm(Clinical$cancer_age);qqline(Clinical$cancer_age, col = 2) Ich habe keine große Erfahrung mit Statistik, …



2
Ist Gelenknormalität eine notwendige Bedingung für die Normalität der Summe normaler Zufallsvariablen?
In Kommentaren , die meiner Antwort auf eine verwandte Frage folgen, fragten Benutzer ssdecontrol und Glen_b, ob eine gemeinsame Normalität von und notwendig ist, um die Normalität der Summe zu behaupten . Dass Gelenknormalität ausreicht, ist natürlich bekannt. Diese Zusatzfrage wurde dort nicht angesprochen und ist vielleicht für sich allein …


1
Ungefähre Verteilung des Produkts von N normal iid? Sonderfall μ≈0
Gegeben IId X n ≈ N ( μ X , σ 2 X ) und μ X ≈ 0 , sucht nach:N≥30N≥30N\geq30Xn≈N(μX,σ2X)Xn≈N(μX,σX2)X_n\approx\mathcal{N}(\mu_X,\sigma_X^2)μX≈0μX≈0\mu_X \approx 0 genaue geschlossene Formverteilungsnäherung von YN=∏1NXnYN=∏1NXnY_N=\prod\limits_{1}^{N}{X_n} asymptotisch ( exponentiell) ?) Approximation des gleichen Produkts Dies ist ein Sonderfall einer allgemeineren Frage .μX≈0μX≈0\mu_X \approx 0


4
Welches Verhältnis der unabhängigen Verteilungen ergibt eine Normalverteilung?
Das Verhältnis zweier unabhängiger Normalverteilungen ergibt eine Cauchy-Verteilung. Die t-Verteilung ist eine Normalverteilung geteilt durch eine unabhängige Chi-Quadrat-Verteilung. Das Verhältnis von zwei unabhängigen Chi-Quadrat-Verteilungen ergibt eine F-Verteilung. Ich suche ein Verhältnis unabhängiger stetiger Verteilungen, das eine normalverteilte Zufallsvariable mit mittlerem μμ\mu und Varianz ergibt ?σ2σ2\sigma^2 Es gibt wahrscheinlich unendlich viele …



5
Wie führt man eine Imputation von Werten in einer sehr großen Anzahl von Datenpunkten durch?
Ich habe einen sehr großen Datensatz und es fehlen ungefähr 5% zufällige Werte. Diese Variablen sind miteinander korreliert. Der folgende Beispiel-R-Datensatz ist nur ein Spielzeugbeispiel mit Dummy-korrelierten Daten. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.