Statistiken und Big Data normal-distribution

8

Ich bin auf der Suche nach einer Verteilung, bei der die Wahrscheinlichkeitsdichte nach einem Punkt, der vom Mittelwert abweicht, schnell abnimmt, oder nach meinen eigenen Worten nach einer "plateauförmigen Verteilung". Etwas zwischen der Gaußschen und der Uniform.

30 distributions normal-distribution uniform

2

Warum sollten wir t Fehler anstelle von normalen Fehlern verwenden?

In diesem Blog-Beitrag von Andrew Gelman gibt es folgende Passage: Die Bayes'schen Modelle von vor 50 Jahren scheinen hoffnungslos einfach (außer natürlich für einfache Probleme), und ich gehe davon aus, dass die heutigen Bayes'schen Modelle in 50 Jahren hoffnungslos einfach erscheinen werden. (Nur als einfaches Beispiel: Wir sollten wahrscheinlich überall …

30 distributions bayesian normal-distribution model robust

5

Zufallszahlen manuell generieren

Wie kann ich aus einer gegebenen Verteilung manuell eine Zufallszahl generieren, beispielsweise 10 Realisierungen aus der Standardnormalverteilung?

30 normal-distribution simulation monte-carlo random-generation randomness

5

Gibt es eine Erklärung dafür, warum es so viele natürliche Phänomene gibt, die der Normalverteilung folgen?

Ich halte das für ein faszinierendes Thema und verstehe es nicht ganz. Welches physikalische Gesetz bewirkt, dass so viele Naturphänomene normalverteilt sind? Es wäre intuitiver, wenn sie gleich verteilt wären. Es ist so schwer für mich, das zu verstehen, und ich habe das Gefühl, dass mir einige Informationen fehlen. Kann …

29 distributions normal-distribution normality-assumption uniform

5

Umgang mit hierarchischen / verschachtelten Daten beim maschinellen Lernen

Ich werde mein Problem mit einem Beispiel erklären. Angenommen, Sie möchten das Einkommen einer Person anhand einiger Attribute vorhersagen: {Alter, Geschlecht, Land, Region, Stadt}. Sie haben einen Trainingsdatensatz wie diesen train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) …

29 regression machine-learning multilevel-analysis correlation dataset spatial paired-comparisons cross-correlation clustering aic bic dependent-variable k-means mean standard-error measurement-error errors-in-variables regression multiple-regression pca linear-model dimensionality-reduction machine-learning neural-networks deep-learning conv-neural-network computer-vision clustering spss r weighted-data wilcoxon-signed-rank bayesian hierarchical-bayesian bugs stan distributions categorical-data variance ecology r survival regression r-squared descriptive-statistics cross-section maximum-likelihood factor-analysis likert r multiple-imputation propensity-scores distributions t-test logit probit z-test confidence-interval poisson-distribution deep-learning conv-neural-network residual-networks r survey wilcoxon-mann-whitney ranking kruskal-wallis bias loss-functions frequentist decision-theory risk machine-learning distributions normal-distribution multivariate-analysis inference dataset factor-analysis survey multilevel-analysis clinical-trials

3

Wie unterscheidet sich die Poisson-Verteilung von der Normalverteilung?

Ich habe einen Vektor mit einer Poisson-Verteilung wie folgt generiert: x = rpois(1000,10) Wenn ich ein Histogramm mit mache hist(x), sieht die Verteilung wie eine bekannte glockenförmige Normalverteilung aus. Ein Kolmogorov-Smirnoff-Test zeigt jedoch, ks.test(x, 'pnorm',10,3)dass sich die Verteilung aufgrund des sehr geringen pWerts erheblich von einer Normalverteilung unterscheidet . Meine …

29 distributions histogram normal-distribution poisson-distribution

3

R: Zufällige Gesamtstruktur, die NaN / Inf im Fehler "fremder Funktionsaufruf" trotz fehlender NaNs im Datensatz auslöst [geschlossen]

Ich verwende Caret, um eine kreuzvalidierte zufällige Gesamtstruktur über ein Dataset auszuführen. Die Y-Variable ist ein Faktor. In meinem Datensatz befinden sich keine NaNs, Infs oder NAs. Allerdings bekomme ich, wenn ich den zufälligen Wald laufen lasse Error in randomForest.default(m, y, ...) : NA/NaN/Inf in foreign function call (arg 1) …

29 r random-forest caret regression prediction fitting social-science poisson-distribution distributions characteristic-function bayesian prior regression normal-distribution interaction nonparametric skewness svm standard-deviation standard-error regression-coefficients igraph natural-language word2vec word-embeddings regression machine-learning sampling r regression machine-learning random-forest ensemble sampling unbiased-estimator proof estimators mse probability conditional-probability bayes anova missing-data neural-networks recommender-system r confidence-interval sample multiple-imputation r time-series forecasting mase

2

Weißes Rauschen in der Statistik

Ich sehe oft den Begriff weißes Rauschen, wenn ich über verschiedene statistische Modelle lese. Ich muss jedoch zugeben, dass ich nicht ganz sicher bin, was das bedeutet. Es wird normalerweise als abgekürzt . Bedeutet das, dass es normal verteilt ist, oder könnte es irgendeiner Verteilung folgen?WN( 0 , σ2)WN(0,σ2)WN(0,σ^2)

28 normal-distribution white-noise

3

Gaußsche Verteilungsverhältnis: Derivatives WRT Basiswert

Ich arbeite mit zwei unabhängigen Normalverteilungen und mit den Mitteln und und den Varianzen und .Y μ x μ y σ 2 x σ 2 yXXXY.Y.Yμxμx\mu_xμyμy\mu_yσ2xσx2\sigma^2_xσ2yσy2\sigma^2_y Ich bin an der Verteilung ihres Verhältnisses interessiert . Weder noch haben einen Mittelwert von Null, daher wird nicht als Cauchy verteilt.X Y ZZ= …

28 distributions normal-distribution references mathematical-statistics cdf

5

Beispiele für gängige Distributionen aus der Praxis

Ich bin ein Student, der ein Interesse für Statistik entwickelt. Ich mag das Material über alles, aber manchmal fällt es mir schwer, über Anwendungen für das wirkliche Leben nachzudenken. Insbesondere geht es bei meiner Frage um häufig verwendete statistische Verteilungen (normal - Beta-Gamma usw.). Ich denke, in einigen Fällen erhalte …

28 normal-distribution references gamma-distribution beta-distribution application

2

Warum ist der mittlere quadratische Fehler die Kreuzentropie zwischen der empirischen Verteilung und einem Gaußschen Modell?

In 5.5, Deep Learning (von Ian Goodfellow, Yoshua Bengio und Aaron Courville) heißt es: Jeder Verlust, der aus einer negativen logarithmischen Wahrscheinlichkeit besteht, ist eine Kreuzentropie zwischen der empirischen Verteilung, die durch den Trainingssatz definiert ist, und der Wahrscheinlichkeitsverteilung, die durch das Modell definiert ist. Zum Beispiel ist der mittlere …

28 machine-learning normal-distribution cross-entropy

1

Können Freiheitsgrade eine nicht ganzzahlige Zahl sein?

Wenn ich GAM verwende, erhalte ich einen DF-Rest von (letzte Zeile im Code). Was bedeutet das? Über das GAM-Beispiel hinausgehend: Kann die Anzahl der Freiheitsgrade im Allgemeinen eine nicht ganzzahlige Zahl sein?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median …

27 r degrees-of-freedom gam machine-learning pca lasso probability self-study bootstrap expected-value regression machine-learning linear-model probability simulation random-generation machine-learning distributions svm libsvm classification pca multivariate-analysis feature-selection archaeology r regression dataset simulation r regression time-series forecasting predictive-models r mean sem lavaan machine-learning regularization regression conv-neural-network convolution classification deep-learning conv-neural-network regression categorical-data econometrics r confirmatory-factor scale-invariance self-study unbiased-estimator mse regression residuals sampling random-variable sample probability random-variable convergence r survival weibull references autocorrelation hypothesis-testing distributions correlation regression statistical-significance regression-coefficients univariate categorical-data chi-squared regression machine-learning multiple-regression categorical-data linear-model pca factor-analysis factor-rotation classification scikit-learn logistic p-value regression panel-data multilevel-analysis variance bootstrap bias probability r distributions interquartile time-series hypothesis-testing normal-distribution normality-assumption kurtosis arima panel-data stata clustered-standard-errors machine-learning optimization lasso multivariate-analysis ancova machine-learning cross-validation

1

Earth Mover's Distance (EMD) zwischen zwei Gaußschen

Gibt es eine geschlossene Formel für die EMD zwischen x1∼N(μ1,Σ1)x1∼N(μ1,Σ1)x_1\sim N(\mu_1, \Sigma_1) und x2∼N(μ2,Σ2)x2∼N(μ2,Σ2)x_2 \sim N(\mu_2, \Sigma_2) ?

26 normal-distribution distance

5

Wie verwendet die lineare Regression die Normalverteilung?

Bei der linearen Regression wird angenommen, dass jeder vorhergesagte Wert aus einer Normalverteilung möglicher Werte ausgewählt wurde. Siehe unten. Aber warum wird angenommen, dass jeder vorhergesagte Wert aus einer Normalverteilung stammt? Wie verwendet die lineare Regression diese Annahme? Was ist, wenn mögliche Werte nicht normalverteilt sind?

26 regression probability distributions normal-distribution modeling

3

Wie berechnet man das Konfidenzintervall des Verhältnisses zweier normaler Mittelwerte?

Ich möchte die Grenzwerte für das Konfidenzintervall von für das Verhältnis zweier ableiten . Angenommen, und sind unabhängig, wobei das mittlere Verhältnis ; . Ich habe versucht zu lösen: aber diese Gleichung konnte in vielen Fällen nicht gelöst werden (keine Wurzeln). Mache ich etwas falsch? Gibt es einen besseren Ansatz? …

26 normal-distribution mean

Als «normal-distribution» getaggte Fragen