Statistiken und Big Data goodness-of-fit

5

Kann ich einen Hypothesentest für verzerrte normale Daten durchführen?

Ich habe eine Sammlung von Daten, von denen ich ursprünglich dachte, dass sie normal verteilt sind. Dann habe ich es mir tatsächlich angesehen und festgestellt, dass dies nicht der Fall ist, hauptsächlich, weil die Daten verzerrt sind, und ich habe auch einen Shapiro-Wilks-Test durchgeführt. Ich möchte es immer noch mit …

11 hypothesis-testing normal-distribution goodness-of-fit skewness skew-normal

2

Kolmogorov-Smirnov-Test: Die Statistik des p-Werts und des ks-Tests nimmt mit zunehmender Stichprobengröße ab

Warum nehmen p-Werte und ks-Teststatistiken mit zunehmender Stichprobengröße ab? Nehmen Sie diesen Python-Code als Beispiel: import numpy as np from scipy.stats import norm, ks_2samp np.random.seed(0) for n in [10, 100, 1000, 10000, 100000, 1000000]: x = norm(0, 4).rvs(n) y = norm(0, 4.1).rvs(n) print ks_2samp(x, y) Die Ergebnisse sind: Ks_2sampResult(statistic=0.30000000000000004, pvalue=0.67507815371659508) …

11 python p-value goodness-of-fit intuition scipy

2

Fit-Test: Frage zum Anderson-Darling-Test und zum Cramér-von-Mises-Kriterium

Ich lese Webseiten für gute Anpassungstests, als ich zum Anderson-Darling-Test und zum Cramér-von-Mises-Kriterium kam . Bisher habe ich verstanden; es scheint, dass der Anderson-Darling-Test und das Cramér-von-Mises-Kriterium ähnlich sind, nur basierend auf einer anderen Gewichtungsfunktion . Es gibt auch eine Variante des Cramér-von-Mises-Kriteriums namens Watson-Test .www Grundsätzlich habe ich hier …

10 goodness-of-fit anderson-darling

3

Visualisierung der Bayes'schen Anpassungsgüte für die logistische Regression

Für ein Bayes'sches logistisches Regressionsproblem habe ich eine posteriore prädiktive Verteilung erstellt. Ich nehme eine Stichprobe aus der Vorhersageverteilung und erhalte für jede meiner Beobachtungen Tausende von Stichproben von (0,1). Die Visualisierung der Anpassungsgüte ist weniger als interessant, zum Beispiel: Dieses Diagramm zeigt die 10 000 Proben + den beobachteten …

10 bayesian data-visualization classification goodness-of-fit binary-data

3

Wie kann die Anpassungsgüte eines bestimmten nichtlinearen Modells bewertet werden? [geschlossen]

Es ist schwer zu sagen, was hier gefragt wird. Diese Frage ist mehrdeutig, vage, unvollständig, zu weit gefasst oder rhetorisch und kann in ihrer gegenwärtigen Form nicht angemessen beantwortet werden. Wenn Sie Hilfe zur Klärung dieser Frage benötigen, damit sie wieder geöffnet werden kann, besuchen Sie die Hilfe . Geschlossen …

10 nonlinear-regression goodness-of-fit deviance

2

Gibt es einen Anderson-Darling-Fit-Test für zwei Datensätze?

Ich weiß, dass ad.test () zum Testen der Normalität verwendet werden kann. Ist es möglich, ad.test zu erhalten, um die Verteilungen aus zwei Datenproben zu vergleichen? x <- rnorm(1000) y <- rgev(2000) ad.test(x,y) Wie kann ich den Anderson-Darling-Test an 2 Proben durchführen?

10 r goodness-of-fit

1

Wie zeichnet man einen angepassten Graphen und einen tatsächlichen Graphen der Gammaverteilung in einem Diagramm?

Laden Sie das benötigte Paket. library(ggplot2) library(MASS) Generieren Sie 10.000 Zahlen, die an die Gammaverteilung angepasst sind. x <- round(rgamma(100000,shape = 2,rate = 0.2),1) x <- x[which(x>0)] Zeichnen Sie die Wahrscheinlichkeitsdichtefunktion, vorausgesetzt, wir wissen nicht, an welche Verteilung x angepasst ist. t1 <- as.data.frame(table(x)) names(t1) <- c("x","y") t1 <- transform(t1,x=as.numeric(as.character(x))) …

10 r mathematical-statistics goodness-of-fit gamma-distribution ggplot2

4

Zeitdiskretes Ereignisverlaufsmodell (Überlebensmodell) in R.

Ich versuche, ein zeitdiskretes Modell in R einzubauen, bin mir aber nicht sicher, wie ich das machen soll. Ich habe gelesen, dass Sie die abhängige Variable in verschiedenen Zeilen organisieren können, eine für jede glmZeitbeobachtung , und die Funktion mit einem Logit- oder Cloglog-Link verwenden können. In diesem Sinne, ich …

10 r survival pca sas matlab neural-networks r logistic spatial spatial-interaction-model r time-series econometrics var statistical-significance t-test cross-validation sample-size r regression optimization least-squares constrained-regression nonparametric ordinal-data wilcoxon-signed-rank references neural-networks jags bugs hierarchical-bayesian gaussian-mixture r regression svm predictive-models libsvm scikit-learn probability self-study stata sample-size spss wilcoxon-mann-whitney survey ordinal-data likert group-differences r regression anova mathematical-statistics normal-distribution random-generation truncation repeated-measures variance variability distributions random-generation uniform regression r generalized-linear-model goodness-of-fit data-visualization r time-series arima autoregressive confidence-interval r time-series arima autocorrelation seasonality hypothesis-testing bayesian frequentist uninformative-prior correlation matlab cross-correlation

4

Wie kann ich die Pearson -Teststatistik für mangelnde Übereinstimmung mit einem logistischen Regressionsmodell in R berechnen ?

Die Statistik des Wahrscheinlichkeitsverhältnisses (auch bekannt als Abweichung) und der Test auf mangelnde Anpassung (oder Anpassungsgüte) sind für ein logistisches Regressionsmodell (Anpassung unter Verwendung der Funktion) in R ziemlich einfach zu erhalten . Dies kann jedoch sein Es ist leicht, einige Zellzahlen so niedrig zu halten, dass der Test unzuverlässig …

10 r chi-squared logistic generalized-linear-model goodness-of-fit

2

Wie bewertet man die Anpassungsgüte für Überlebensfunktionen?

Ich bin ein Neuling in der Überlebensanalyse, obwohl ich einige Kenntnisse in Klassifikation und Regression habe. Für die Regression haben wir MSE- und R-Quadrat-Statistiken. Aber wie können wir sagen, dass das Überlebensmodell A neben einigen grafischen Darstellungen (KM-Kurve) dem Überlebensmodell B überlegen ist? Wenn möglich, erläutern Sie den Unterschied anhand …

9 regression survival goodness-of-fit cart rpart

3

statistischer Test, um festzustellen, ob die Beziehung linear oder nicht linear ist

Ich habe einen Beispieldatensatz wie folgt: Volume <- seq(1,20,0.1) var1 <- 100 x2 <- 1000000 x3 <- 30 x4 = sqrt(x2/pi) H = x3 - Volume r = (x4*H)/(H + Volume) Power = (var1*x2)/(100*(pi*Volume/3)*(x4*x4 + x4*r + r*r)) Power <- jitter(Power, factor = 1, amount = 0.1) plot(Volume,Power) Aus der …

9 r hypothesis-testing nonlinear-regression goodness-of-fit heteroscedasticity

2

Anpassungsgüte an die Poisson-Verteilung

Was sind einige der bekannten statistischen Tests zur Messung der Anpassungsgüte beobachteter Zufallsvariablen an eine Poissonverteilung? Ich weiß, dass der Kolmogorov-Smirnov-Test einer davon ist. Gibt es noch andere?

9 probability poisson-distribution goodness-of-fit

2

Berechnen Sie die ROC-Kurve für Daten

Ich habe also 16 Studien, in denen ich versuche, eine Person anhand eines biometrischen Merkmals mithilfe von Hamming Distance zu authentifizieren. Mein Schwellenwert ist auf 3,5 eingestellt. Meine Daten sind unten und nur Versuch 1 ist ein wahres Positiv: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 …

9 mathematical-statistics roc classification cross-validation pac-learning r anova survival hazard machine-learning data-mining hypothesis-testing regression random-variable non-independent normal-distribution approximation central-limit-theorem interpolation splines distributions kernel-smoothing r data-visualization ggplot2 distributions binomial random-variable poisson-distribution simulation kalman-filter regression lasso regularization lme4-nlme model-selection aic r mcmc dlm particle-filter r panel-data multilevel-analysis model-selection entropy graphical-model r distributions quantiles qq-plot svm matlab regression lasso regularization entropy inference r distributions dataset algorithms matrix-decomposition regression modeling interaction regularization expected-value exponential gamma-distribution mcmc gibbs probability self-study normality-assumption naive-bayes bayes-optimal-classifier standard-deviation classification optimization control-chart engineering-statistics regression lasso regularization regression references lasso regularization elastic-net r distributions aggregation clustering algorithms regression correlation modeling distributions time-series standard-deviation goodness-of-fit hypothesis-testing statistical-significance sample binary-data estimation random-variable interpolation distributions probability chi-squared predictor outliers regression modeling interaction

1

Anpassungsgüte für diskrete Daten: bester Ansatz

Die Daten: Für die Zwecke dieser Frage / Kommunikation können wir annehmen, dass die Daten wie rnbinom(1000,size=0.1,prob=0.01)in R aussehen , das aus einer negativen Binomialverteilung (mit size=0.1und Wahrscheinlichkeit des Erfolgs prob=0.01) eine Zufallsstichprobe von 1.000 Beobachtungen generiert . Dies ist die Parametrisierung, bei der die Zufallsvariable die Anzahl der Fehler …

9 hypothesis-testing goodness-of-fit

1

Anpassen der negativen Binomialverteilung an Daten mit großer Anzahl

Ich habe ~ 1 Million Datenpunkte. Hier ist der Link zur Datei data.txt. Jeder von ihnen kann einen Wert zwischen 0 und 145 annehmen. Es handelt sich um einen diskreten Datensatz. Unten ist das Histogramm des Datensatzes. Auf der x-Achse ist die Zählung (0-145) und auf der y-Achse ist die …

9 r statistical-significance goodness-of-fit negative-binomial

Als «goodness-of-fit» getaggte Fragen