Ich habe eine Sammlung von Daten, von denen ich ursprünglich dachte, dass sie normal verteilt sind. Dann habe ich es mir tatsächlich angesehen und festgestellt, dass dies nicht der Fall ist, hauptsächlich, weil die Daten verzerrt sind, und ich habe auch einen Shapiro-Wilks-Test durchgeführt. Ich möchte es immer noch mit …
Warum nehmen p-Werte und ks-Teststatistiken mit zunehmender Stichprobengröße ab? Nehmen Sie diesen Python-Code als Beispiel: import numpy as np from scipy.stats import norm, ks_2samp np.random.seed(0) for n in [10, 100, 1000, 10000, 100000, 1000000]: x = norm(0, 4).rvs(n) y = norm(0, 4.1).rvs(n) print ks_2samp(x, y) Die Ergebnisse sind: Ks_2sampResult(statistic=0.30000000000000004, pvalue=0.67507815371659508) …
Ich lese Webseiten für gute Anpassungstests, als ich zum Anderson-Darling-Test und zum Cramér-von-Mises-Kriterium kam . Bisher habe ich verstanden; es scheint, dass der Anderson-Darling-Test und das Cramér-von-Mises-Kriterium ähnlich sind, nur basierend auf einer anderen Gewichtungsfunktion . Es gibt auch eine Variante des Cramér-von-Mises-Kriteriums namens Watson-Test .www Grundsätzlich habe ich hier …
Für ein Bayes'sches logistisches Regressionsproblem habe ich eine posteriore prädiktive Verteilung erstellt. Ich nehme eine Stichprobe aus der Vorhersageverteilung und erhalte für jede meiner Beobachtungen Tausende von Stichproben von (0,1). Die Visualisierung der Anpassungsgüte ist weniger als interessant, zum Beispiel: Dieses Diagramm zeigt die 10 000 Proben + den beobachteten …
Es ist schwer zu sagen, was hier gefragt wird. Diese Frage ist mehrdeutig, vage, unvollständig, zu weit gefasst oder rhetorisch und kann in ihrer gegenwärtigen Form nicht angemessen beantwortet werden. Wenn Sie Hilfe zur Klärung dieser Frage benötigen, damit sie wieder geöffnet werden kann, besuchen Sie die Hilfe . Geschlossen …
Ich weiß, dass ad.test () zum Testen der Normalität verwendet werden kann. Ist es möglich, ad.test zu erhalten, um die Verteilungen aus zwei Datenproben zu vergleichen? x <- rnorm(1000) y <- rgev(2000) ad.test(x,y) Wie kann ich den Anderson-Darling-Test an 2 Proben durchführen?
Laden Sie das benötigte Paket. library(ggplot2) library(MASS) Generieren Sie 10.000 Zahlen, die an die Gammaverteilung angepasst sind. x <- round(rgamma(100000,shape = 2,rate = 0.2),1) x <- x[which(x>0)] Zeichnen Sie die Wahrscheinlichkeitsdichtefunktion, vorausgesetzt, wir wissen nicht, an welche Verteilung x angepasst ist. t1 <- as.data.frame(table(x)) names(t1) <- c("x","y") t1 <- transform(t1,x=as.numeric(as.character(x))) …
Ich versuche, ein zeitdiskretes Modell in R einzubauen, bin mir aber nicht sicher, wie ich das machen soll. Ich habe gelesen, dass Sie die abhängige Variable in verschiedenen Zeilen organisieren können, eine für jede glmZeitbeobachtung , und die Funktion mit einem Logit- oder Cloglog-Link verwenden können. In diesem Sinne, ich …
Die Statistik des Wahrscheinlichkeitsverhältnisses (auch bekannt als Abweichung) und der Test auf mangelnde Anpassung (oder Anpassungsgüte) sind für ein logistisches Regressionsmodell (Anpassung unter Verwendung der Funktion) in R ziemlich einfach zu erhalten . Dies kann jedoch sein Es ist leicht, einige Zellzahlen so niedrig zu halten, dass der Test unzuverlässig …
Ich bin ein Neuling in der Überlebensanalyse, obwohl ich einige Kenntnisse in Klassifikation und Regression habe. Für die Regression haben wir MSE- und R-Quadrat-Statistiken. Aber wie können wir sagen, dass das Überlebensmodell A neben einigen grafischen Darstellungen (KM-Kurve) dem Überlebensmodell B überlegen ist? Wenn möglich, erläutern Sie den Unterschied anhand …
Was sind einige der bekannten statistischen Tests zur Messung der Anpassungsgüte beobachteter Zufallsvariablen an eine Poissonverteilung? Ich weiß, dass der Kolmogorov-Smirnov-Test einer davon ist. Gibt es noch andere?
Ich habe also 16 Studien, in denen ich versuche, eine Person anhand eines biometrischen Merkmals mithilfe von Hamming Distance zu authentifizieren. Mein Schwellenwert ist auf 3,5 eingestellt. Meine Daten sind unten und nur Versuch 1 ist ein wahres Positiv: Trial Hamming Distance 1 0.34 2 0.37 3 0.34 4 0.29 …
Die Daten: Für die Zwecke dieser Frage / Kommunikation können wir annehmen, dass die Daten wie rnbinom(1000,size=0.1,prob=0.01)in R aussehen , das aus einer negativen Binomialverteilung (mit size=0.1und Wahrscheinlichkeit des Erfolgs prob=0.01) eine Zufallsstichprobe von 1.000 Beobachtungen generiert . Dies ist die Parametrisierung, bei der die Zufallsvariable die Anzahl der Fehler …
Ich habe ~ 1 Million Datenpunkte. Hier ist der Link zur Datei data.txt. Jeder von ihnen kann einen Wert zwischen 0 und 145 annehmen. Es handelt sich um einen diskreten Datensatz. Unten ist das Histogramm des Datensatzes. Auf der x-Achse ist die Zählung (0-145) und auf der y-Achse ist die …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.