Ich interessiere mich für folgende einseitige Cantelli-Version der Chebyshev-Ungleichung : P(X−E(X)≥t)≤Var(X)Var(X)+t2.P(X−E(X)≥t)≤Var(X)Var(X)+t2. \mathbb P(X - \mathbb E (X) \geq t) \leq \frac{\mathrm{Var}(X)}{\mathrm{Var}(X) + t^2} \,. Wenn Sie den Populationsmittelwert und die Varianz kennen, können Sie die Obergrenze für die Wahrscheinlichkeit der Beobachtung eines bestimmten Werts berechnen. (Das habe ich zumindest verstanden.) …
Winsorizing Daten Mittel ersetzen die Extremwerte eines Datensatzes mit einem bestimmten Perzentilwert von jedem Ende, während Trimm- oder Abschneiden beinhaltet das Entfernen dieser Extremwerte. Ich sehe beide diskutierten Methoden immer als eine praktikable Option, um die Auswirkung von Ausreißern bei der Berechnung von Statistiken wie dem Mittelwert oder der Standardabweichung …
Diese Frage wurde von meinem Freund gestellt, der nicht mit dem Internet vertraut ist. Ich habe keinen statistischen Hintergrund und habe im Internet nach dieser Frage gesucht. Die Frage ist: Ist es möglich, Ausreißer durch Mittelwerte zu ersetzen? Wenn es möglich ist, gibt es Buchreferenzen / Zeitschriften, um diese Aussage …
Wikipedia erklärt: Bei einem Datensatz ist der Mittelwert die Summe der Werte geteilt durch die Anzahl der Werte. Diese Definition entspricht jedoch dem, was ich "Durchschnitt" nenne (zumindest erinnere ich mich daran, dass ich dies gelernt habe). Noch einmal zitiert Wikipedia: Es gibt andere statistische Kennzahlen, die Stichproben verwenden, die …
Ich weiß, dass diese Frage mit dem Fall mean = median gestellt wurde, aber ich habe nichts im Zusammenhang mit mean = mode gefunden. Wenn der Modus dem Mittelwert entspricht, kann ich dann immer zu dem Schluss kommen, dass es sich um eine symmetrische Verteilung handelt? Muss ich auf diese …
Stark verzerrte Verteilungen wie die Protokollnormale führen nicht zu genauen Bootstrap-Konfidenzintervallen. Hier ist ein Beispiel, das zeigt, dass der linke und der rechte Heckbereich weit vom idealen Wert von 0,025 entfernt sind, unabhängig davon, welche Bootstrap-Methode Sie in R versuchen: require(boot) n <- 25 B <- 1000 nsim <- 1000 …
Ich werde mein Problem mit einem Beispiel erklären. Angenommen, Sie möchten das Einkommen einer Person anhand einiger Attribute vorhersagen: {Alter, Geschlecht, Land, Region, Stadt}. Sie haben einen Trainingsdatensatz wie diesen train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) …
Einerseits habe ich die Regression zum Mittelwert und andererseits habe ich den Trugschluss des Spielers . Der Irrtum von Gambler wird von Miller und Sanjurjo (2019) definiert als "die irrtümliche Annahme, dass zufällige Sequenzen eine systematische Tendenz zur Umkehrung aufweisen, dh dass Streifen mit ähnlichen Ergebnissen eher enden als andauern". …
Wenn ich GAM verwende, erhalte ich einen DF-Rest von (letzte Zeile im Code). Was bedeutet das? Über das GAM-Beispiel hinausgehend: Kann die Anzahl der Freiheitsgrade im Allgemeinen eine nicht ganzzahlige Zahl sein?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median …
Bei der Durchführung von hierarchischen Clustern können viele Metriken verwendet werden, um den Abstand zwischen Clustern zu messen. Zwei solche Metriken implizieren die Berechnung der Schwerpunkte und der Mittelwerte der Datenpunkte in den Clustern. Was ist der Unterschied zwischen dem Mittelwert und dem Schwerpunkt? Sind das nicht die gleichen Punkte …
Ich möchte die Grenzwerte für das Konfidenzintervall von für das Verhältnis zweier ableiten . Angenommen, und sind unabhängig, wobei das mittlere Verhältnis ; . Ich habe versucht zu lösen: aber diese Gleichung konnte in vielen Fällen nicht gelöst werden (keine Wurzeln). Mache ich etwas falsch? Gibt es einen besseren Ansatz? …
Gibt es irgendetwas Bedeutendes an einem geometrischen Mittelwert und einem arithmetischen Mittelwert, die sehr nahe beieinander liegen, sagen wir ~ 0,1%? Welche Vermutungen lassen sich über einen solchen Datensatz anstellen? Ich habe gerade an der Analyse eines Datensatzes gearbeitet und merke, dass die Werte ironischerweise sehr, sehr nahe beieinander liegen. …
Ich weiß, dass, wenn der Median und der Mittelwert ungefähr gleich sind, dies bedeutet, dass es eine symmetrische Verteilung gibt, aber in diesem speziellen Fall bin ich nicht sicher. Der Mittelwert und der Median liegen ziemlich nahe beieinander (nur 0,487 m / Gallonen Unterschied), was mich zu der Annahme veranlassen …
In Abschnitt 1.7.2 der Ermittlung von Statistiken mithilfe von R von Andy Fields und einer Auflistung der Vorteile von Mittelwert und Median heißt es: ... ist der Mittelwert in verschiedenen Proben tendenziell stabil. Dies, nachdem die vielen Tugenden des Medians erklärt wurden, z ... Der Median ist relativ unbeeinflusst von …
Viele PDFs reichen von minus bis positiv unendlich, aber einige Mittel sind definiert und andere nicht. Welches gemeinsame Merkmal macht einige berechenbar?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.