Statistiken und Big Data confidence-interval

2

Oberes Vertrauen in maschinelles Lernen gebunden

Ich bin auf die Formel gestoßen, um die oberen Vertrauensgrenzen für das Problem der k-bewaffneten Banditen zu erreichen: c ln N.ichnich- -- -- -- -- -√clnNinic\sqrt{\frac{\text{ln} N_i}{n_i}} Dabei ist die Anzahl der Proben, die wir für diesen bestimmten Banditen haben, und die Gesamtmenge der Proben, die wir von allen Banditen …

8 machine-learning mathematical-statistics confidence-interval reinforcement-learning multiarmed-bandit

2

Uneinigkeit zwischen p-Werten und Konfidenzintervallen

Dies ist eine Frage zum T-Test in SPSS. Ich habe zwei Gruppen und möchte testen, ob die beiden Mittelwerte gleich sind. Ich benutze den T-Test mit Bootstrapping. Am Ende bekam ich einen p-Wert <0,005, was mich im Allgemeinen veranlassen würde, die Nullhypothese abzulehnen, dass die Mittelwerte der beiden Populationen gleich …

8 confidence-interval t-test p-value spss

1

Konfidenzintervall für xgb-Prognose

Experten! Vielleicht wissen Sie, wie man das Konfidenzintervall für xgboost berechnet? Eine klassische Formel mit T-Verteilung kann nicht helfen, da meine Daten nicht normal verteilt sind. Oder spielt das keine Rolle? Wenn Sie Literatur vorschlagen, ist dies sehr nützlich, aber auch Ansätze in R und Python (im Kontext der Bibliothek …

8 confidence-interval xgboost

2

Seltsames Muster bei der Schätzung des Standardabweichungs-Konfidenzintervalls über Bootstrapping

Ich wollte das Konfidenzintervall für die Standardabweichung für einige Daten schätzen. Der R-Code sieht wie folgt aus: library(boot) sd_boot <- function (x, ind) { res <- sd(x$ReadyChange[ind], na.rm = TRUE) return(res) } data_boot <- boot::boot(data, statistic = sd_boot, R = 10000) plot(data_boot) Und ich habe die nächste Handlung: Ich kann …

8 r confidence-interval standard-deviation bootstrap

2

Gibt es eine nützliche Möglichkeit, das „beste“ Konfidenzintervall zu definieren?

Die Standarddefinition von (sagen wir) einem 95% -Konfidenzintervall (CI) erfordert lediglich, dass die Wahrscheinlichkeit, dass es den wahren Parameter enthält, 95% beträgt. Offensichtlich ist dies nicht eindeutig. Die Sprache, die ich gesehen habe, legt nahe, dass es unter den vielen gültigen CI normalerweise sinnvoll ist, so etwas wie das kürzeste …

8 hypothesis-testing confidence-interval

1

Konfidenzintervall des dritten Moments der Normalverteilung

Wie berechnet man das genaue Konfidenzintervall für den dritten Moment der Normalverteilung ?N(a,σ2)N.(ein,σ2)N(a, \sigma^2)

8 probability normal-distribution mathematical-statistics confidence-interval

1

Gibt Ihnen die invertierbare monotone Transformation eines Konfidenzintervalls ein Konfidenzintervall (auf derselben Ebene) im transformierten Raum?

Annehmen (a,b)(a,b) (a,b) ist ein Konfidenzintervall für einen Parameter . Angenommen, ist eine monotone invertierbare Transformation. Dann ist(1−α)(1−α)(1-\alpha)θθ\thetaηη\eta (η(a),η(b))(η(a),η(b)) \left (\eta(a), \eta(b) \right ) ein Konfidenzintervall für ? Angenommen, der Parameter und die Endpunkte des Konfidenzintervalls sind reelle Zahlen.(1−α)(1−α)(1-\alpha)η(θ)η(θ)\eta(\theta) Die Antwort scheint intuitiv auf „Ja“ aus ähnlichen Gründen, warum Sie …

8 confidence-interval

1

Konfidenzintervalle für ECDF

Die Dvoretzky-Kiefer-Wolfowitz-Ungleichung ist folgende: P.r ( sup | F.^n( x ) - F.( x ) | > ϵ ) ≤ 2 exp( - 2 n ϵ2)Pr(sup|F^n(x)−F(x)|>ϵ)≤2exp⁡(−2nϵ2)Pr(\text{sup}|\hat{F}_n(x)-F(x)|>\epsilon)\leq 2\exp(-2n\epsilon^2) , und es sagt voraus, wie nahe eine empirisch bestimmte Verteilungsfunktion an der Verteilungsfunktion sein wird, aus der die empirischen Proben gezogen werden. …

8 confidence-interval ordinal-data

4

Wäre ein

Nehmen wir an, wir kennen den Mittelwert einer bestimmten Verteilung. Beeinflusst dies die Intervallschätzung der Varianz einer Zufallsvariablen (die ansonsten anhand der Stichprobenvarianz berechnet wird)? Können wir wie in ein kleineres Intervall für das gleiche Konfidenzniveau erhalten?

8 normal-distribution confidence-interval variance

1

Wird angenommen, dass Gruppeneffekte in einem Modell mit gemischten Effekten aus einer Normalverteilung ausgewählt wurden?

Angenommen, wir sind daran interessiert, wie sich die Anzahl der Stunden, die diese Schüler studieren, auf die Noten der Schülerprüfungen auswirkt. Wir befragen Schüler aus verschiedenen Schulen. Wir führen das folgende Modell mit gemischten Effekten aus: Exam.gradesich= a + β1× Stunden studiertich+ Schulej+ eichexam.gradesi=a+β1×hours.studiedi+schoolj+ei \text{exam.grades}_i = a + \beta_1 \times …

8 regression normal-distribution confidence-interval mixed-model variance

1

Warum sollte ich einen Bootstrap durchführen wollen, wenn ich einen unabhängigen Beispiel-T-Test berechne? (wie man einen Bootstrap-T-Test rechtfertigt, interpretiert und meldet)

Angenommen, ich habe zwei Bedingungen und meine Stichprobengröße für die beiden Bedingungen ist extrem niedrig. Nehmen wir an, ich habe nur 14 Beobachtungen in der ersten Bedingung und 11 in der anderen. Ich möchte den t-Test verwenden, um zu testen, ob sich die mittleren Unterschiede signifikant voneinander unterscheiden. Erstens bin …

8 confidence-interval t-test bootstrap normality-assumption reporting

1

Schätzen von Parametern für ein Binomial

Zunächst möchte ich präzisieren, dass ich kein Experte für dieses Thema bin. Angenommen, zwei Zufallsvariablen und sind binomisch, bzw. Beachten Sie hier, dass gleich ist. Ich weiß, dassXXXYYYX∼B(n1,p)X∼B(n1,p)X\sim B(n_1,p)Y∼B(n2,p),Y∼B(n2,p),Y\sim B(n_2,p),pppZ=X+Y∼B(n1+n2,p).Z=X+Y∼B(n1+n2,p).Z=X+Y \sim B(n_1+n_2,p). Sei eine Stichprobe für und eine Stichprobe für , gibt es eine Standardmethode zur Schätzung von und ?{x1,…,xk}{x1,…,xk}\{x_1,\ldots,x_k\}XXX{y1,…,yk}{y1,…,yk}\{y_1,\ldots,y_k\}YYYn=n1+n2n=n1+n2n=n_1+n_2ppp …

8 mathematical-statistics confidence-interval estimation maximum-likelihood binomial

5

Konfidenzintervall für eine zufällige Menge?

Angenommen, ist ein unbekannter Vektor, und man beobachtet . Ich möchte Konfidenzintervalle für die Zufallsmenge berechnen , die nur auf dem beobachteten und dem bekannten Parameter basiert . Das heißt, für ein gegebenes finden Sie so, dass .a⃗ a→\vec{a}pppb⃗ ∼N(a⃗ ,I)b→∼N(a→,I)\vec{b} \sim \mathcal{N}\left(\vec{a}, I\right)b⃗ ⊤a⃗ b→⊤a→\vec{b}^{\top} \vec{a}b⃗ b→\vec{b}pppα∈(0,1)α∈(0,1)\alpha \in (0,1)c(b⃗ …

8 confidence-interval multivariate-analysis chi-squared non-central

1

Berechnung von 95% CI bei einem Anteil von 0%

Ich habe eine Stichprobe von 72 Personen. 0 davon hatten die Eigenschaft, die ich untersuche. Wie berechne ich den 95% CI, wenn der Anteil 0% beträgt?

8 confidence-interval

2

Warum würde ein statistisches Modell bei einem riesigen Datensatz überanpassen?

Für mein aktuelles Projekt muss ich möglicherweise ein Modell erstellen, um das Verhalten einer bestimmten Personengruppe vorherzusagen. Der Trainingsdatensatz enthält nur 6 Variablen (ID dient nur zu Identifikationszwecken): id, age, income, gender, job category, monthly spend in dem monthly spendist die Antwortvariable. Der Trainingsdatensatz enthält jedoch ungefähr 3 Millionen Zeilen, …

8 modeling large-data overfitting clustering algorithms error spatial r regression predictive-models linear-model average measurement-error weighted-mean error-propagation python standard-error weighted-regression hypothesis-testing time-series machine-learning self-study arima regression correlation anova statistical-significance excel r regression distributions statistical-significance contingency-tables regression optimization measurement-error loss-functions image-processing java panel-data probability conditional-probability r lme4-nlme model-comparison time-series probability probability conditional-probability logistic multiple-regression model-selection r regression model-based-clustering svm feature-selection feature-construction time-series forecasting stationarity r distributions bootstrap r distributions estimation maximum-likelihood garch references probability conditional-probability regression logistic regression-coefficients model-comparison confidence-interval r regression r generalized-linear-model outliers robust regression classification categorical-data r association-rules machine-learning distributions posterior likelihood r hypothesis-testing normality-assumption missing-data convergence expectation-maximization regression self-study categorical-data regression simulation regression self-study self-study gamma-distribution modeling microarray synthetic-data

Als «confidence-interval» getaggte Fragen