Als «confidence-interval» getaggte Fragen

Ein Konfidenzintervall ist ein Intervall, das einen unbekannten Parameter mit abdeckt (1α)%Vertrauen. Konfidenzintervalle sind ein häufig vorkommendes Konzept. Sie werden oft mit glaubwürdigen Intervallen verwechselt, was das Bayes'sche Analogon ist.

2
Oberes Vertrauen in maschinelles Lernen gebunden
Ich bin auf die Formel gestoßen, um die oberen Vertrauensgrenzen für das Problem der k-bewaffneten Banditen zu erreichen: c ln N.ichnich- -- -- -- -- -√clnNinic\sqrt{\frac{\text{ln} N_i}{n_i}} Dabei ist die Anzahl der Proben, die wir für diesen bestimmten Banditen haben, und die Gesamtmenge der Proben, die wir von allen Banditen …


1
Konfidenzintervall für xgb-Prognose
Experten! Vielleicht wissen Sie, wie man das Konfidenzintervall für xgboost berechnet? Eine klassische Formel mit T-Verteilung kann nicht helfen, da meine Daten nicht normal verteilt sind. Oder spielt das keine Rolle? Wenn Sie Literatur vorschlagen, ist dies sehr nützlich, aber auch Ansätze in R und Python (im Kontext der Bibliothek …

2
Seltsames Muster bei der Schätzung des Standardabweichungs-Konfidenzintervalls über Bootstrapping
Ich wollte das Konfidenzintervall für die Standardabweichung für einige Daten schätzen. Der R-Code sieht wie folgt aus: library(boot) sd_boot <- function (x, ind) { res <- sd(x$ReadyChange[ind], na.rm = TRUE) return(res) } data_boot <- boot::boot(data, statistic = sd_boot, R = 10000) plot(data_boot) Und ich habe die nächste Handlung: Ich kann …



1
Gibt Ihnen die invertierbare monotone Transformation eines Konfidenzintervalls ein Konfidenzintervall (auf derselben Ebene) im transformierten Raum?
Annehmen (a,b)(a,b) (a,b) ist ein Konfidenzintervall für einen Parameter . Angenommen, ist eine monotone invertierbare Transformation. Dann ist(1−α)(1−α)(1-\alpha)θθ\thetaηη\eta (η(a),η(b))(η(a),η(b)) \left (\eta(a), \eta(b) \right ) ein Konfidenzintervall für ? Angenommen, der Parameter und die Endpunkte des Konfidenzintervalls sind reelle Zahlen.(1−α)(1−α)(1-\alpha)η(θ)η(θ)\eta(\theta) Die Antwort scheint intuitiv auf „Ja“ aus ähnlichen Gründen, warum Sie …

1
Konfidenzintervalle für ECDF
Die Dvoretzky-Kiefer-Wolfowitz-Ungleichung ist folgende: P.r ( sup | F.^n( x ) - F.( x ) | > ϵ ) ≤ 2 exp( - 2 n ϵ2)Pr(sup|F^n(x)−F(x)|>ϵ)≤2exp⁡(−2nϵ2)Pr(\text{sup}|\hat{F}_n(x)-F(x)|>\epsilon)\leq 2\exp(-2n\epsilon^2) , und es sagt voraus, wie nahe eine empirisch bestimmte Verteilungsfunktion an der Verteilungsfunktion sein wird, aus der die empirischen Proben gezogen werden. …

4
Wäre ein
Nehmen wir an, wir kennen den Mittelwert einer bestimmten Verteilung. Beeinflusst dies die Intervallschätzung der Varianz einer Zufallsvariablen (die ansonsten anhand der Stichprobenvarianz berechnet wird)? Können wir wie in ein kleineres Intervall für das gleiche Konfidenzniveau erhalten?

1
Wird angenommen, dass Gruppeneffekte in einem Modell mit gemischten Effekten aus einer Normalverteilung ausgewählt wurden?
Angenommen, wir sind daran interessiert, wie sich die Anzahl der Stunden, die diese Schüler studieren, auf die Noten der Schülerprüfungen auswirkt. Wir befragen Schüler aus verschiedenen Schulen. Wir führen das folgende Modell mit gemischten Effekten aus: Exam.gradesich= a + β1× Stunden studiertich+ Schulej+ eichexam.gradesi=a+β1×hours.studiedi+schoolj+ei \text{exam.grades}_i = a + \beta_1 \times …

1
Warum sollte ich einen Bootstrap durchführen wollen, wenn ich einen unabhängigen Beispiel-T-Test berechne? (wie man einen Bootstrap-T-Test rechtfertigt, interpretiert und meldet)
Angenommen, ich habe zwei Bedingungen und meine Stichprobengröße für die beiden Bedingungen ist extrem niedrig. Nehmen wir an, ich habe nur 14 Beobachtungen in der ersten Bedingung und 11 in der anderen. Ich möchte den t-Test verwenden, um zu testen, ob sich die mittleren Unterschiede signifikant voneinander unterscheiden. Erstens bin …

1
Schätzen von Parametern für ein Binomial
Zunächst möchte ich präzisieren, dass ich kein Experte für dieses Thema bin. Angenommen, zwei Zufallsvariablen und sind binomisch, bzw. Beachten Sie hier, dass gleich ist. Ich weiß, dassXXXYYYX∼B(n1,p)X∼B(n1,p)X\sim B(n_1,p)Y∼B(n2,p),Y∼B(n2,p),Y\sim B(n_2,p),pppZ=X+Y∼B(n1+n2,p).Z=X+Y∼B(n1+n2,p).Z=X+Y \sim B(n_1+n_2,p). Sei eine Stichprobe für und eine Stichprobe für , gibt es eine Standardmethode zur Schätzung von und ?{x1,…,xk}{x1,…,xk}\{x_1,\ldots,x_k\}XXX{y1,…,yk}{y1,…,yk}\{y_1,\ldots,y_k\}YYYn=n1+n2n=n1+n2n=n_1+n_2ppp …

5
Konfidenzintervall für eine zufällige Menge?
Angenommen, ist ein unbekannter Vektor, und man beobachtet . Ich möchte Konfidenzintervalle für die Zufallsmenge berechnen , die nur auf dem beobachteten und dem bekannten Parameter basiert . Das heißt, für ein gegebenes finden Sie so, dass .a⃗ a→\vec{a}pppb⃗ ∼N(a⃗ ,I)b→∼N(a→,I)\vec{b} \sim \mathcal{N}\left(\vec{a}, I\right)b⃗ ⊤a⃗ b→⊤a→\vec{b}^{\top} \vec{a}b⃗ b→\vec{b}pppα∈(0,1)α∈(0,1)\alpha \in (0,1)c(b⃗ …


2
Warum würde ein statistisches Modell bei einem riesigen Datensatz überanpassen?
Für mein aktuelles Projekt muss ich möglicherweise ein Modell erstellen, um das Verhalten einer bestimmten Personengruppe vorherzusagen. Der Trainingsdatensatz enthält nur 6 Variablen (ID dient nur zu Identifikationszwecken): id, age, income, gender, job category, monthly spend in dem monthly spendist die Antwortvariable. Der Trainingsdatensatz enthält jedoch ungefähr 3 Millionen Zeilen, …
8 modeling  large-data  overfitting  clustering  algorithms  error  spatial  r  regression  predictive-models  linear-model  average  measurement-error  weighted-mean  error-propagation  python  standard-error  weighted-regression  hypothesis-testing  time-series  machine-learning  self-study  arima  regression  correlation  anova  statistical-significance  excel  r  regression  distributions  statistical-significance  contingency-tables  regression  optimization  measurement-error  loss-functions  image-processing  java  panel-data  probability  conditional-probability  r  lme4-nlme  model-comparison  time-series  probability  probability  conditional-probability  logistic  multiple-regression  model-selection  r  regression  model-based-clustering  svm  feature-selection  feature-construction  time-series  forecasting  stationarity  r  distributions  bootstrap  r  distributions  estimation  maximum-likelihood  garch  references  probability  conditional-probability  regression  logistic  regression-coefficients  model-comparison  confidence-interval  r  regression  r  generalized-linear-model  outliers  robust  regression  classification  categorical-data  r  association-rules  machine-learning  distributions  posterior  likelihood  r  hypothesis-testing  normality-assumption  missing-data  convergence  expectation-maximization  regression  self-study  categorical-data  regression  simulation  regression  self-study  self-study  gamma-distribution  modeling  microarray  synthetic-data 

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.