Als «error» getaggte Fragen

Der Fehler einer Schätzung oder Vorhersage ist ihre Abweichung vom wahren Wert, die nicht beobachtbar (z. B. Regressionsparameter) oder beobachtbar (z. B. zukünftige Realisierungen) sein kann. Verwenden Sie das Tag [error-message], um nach Softwarefehlern zu fragen.


2
Fehlerausbreitung SD vs SE
Ich habe 3 bis 5 Maße eines Merkmals pro Person unter zwei verschiedenen Bedingungen (A und B). Ich Plotten der Durchschnitt für jedes einzelne in jedem Zustand und I verwenden , um die Standardfehler ( dh , , wobei = Anzahl der Messungen) als Fehlerbalken. N.SD/N−−√SD/NSD/\sqrt{N}NNN Jetzt möchte ich die …

1
Korrektur für normalverteilte Ungenauigkeiten der Uhr
Ich habe ein Experiment, das auf Hunderten von Computern durchgeführt wird, die auf der ganzen Welt verteilt sind und das Auftreten bestimmter Ereignisse messen. Die Ereignisse hängen voneinander ab, sodass ich sie in aufsteigender Reihenfolge bestellen und dann die Zeitdifferenz berechnen kann. Die Ereignisse sollten exponentiell verteilt sein, aber wenn …

2
Warum verwenden wir Residuen, um die Annahmen zu Regressionsfehlern zu testen?
Angenommen, wir haben ein Modell .Yi=β0+β1Xi1+β2Xi2+⋯+βkXik+ϵiYi=β0+β1Xi1+β2Xi2+⋯+βkXik+ϵiY_i = \beta_0 + \beta_1X_{i1} + \beta_2X_{i2} + \dots + \beta_kX_{ik} + \epsilon_i Die Regression hat eine Reihe von Annahmen, wie zum Beispiel, dass die Fehler normal mit dem Mittelwert Null und der konstanten Varianz verteilt werden sollten. Mir wurde beigebracht, diese Annahmen unter Verwendung …


1
Auswahl der Prioritäten basierend auf dem Messfehler
Wie berechnen Sie den entsprechenden Prior, wenn Sie den Messfehler eines Instruments haben? Dieser Absatz stammt aus Cressies Buch "Statistik für räumlich-zeitliche Daten": Es ist häufig der Fall, dass einige vorherige Informationen bezüglich der Messfehlervarianz verfügbar sind, so dass ein ziemlich informatives Parametermodell spezifiziert werden kann. Wenn wir zum Beispiel …

1
Wann ist eine ordnungsgemäße Bewertungsregel eine bessere Schätzung der Verallgemeinerung in einer Klassifizierungseinstellung?
Ein typischer Ansatz zur Lösung eines Klassifizierungsproblems besteht darin, eine Klasse von Kandidatenmodellen zu identifizieren und dann die Modellauswahl unter Verwendung eines Verfahrens wie einer Kreuzvalidierung durchzuführen. Üblicherweise wählt man das Modell mit der höchsten Genauigkeit oder eine entsprechende Funktion , dass Encodierungen Problem spezifische Informationen, wie FβFβ\text{F}_\beta . Angenommen, …

2
Optimism Bias - Schätzungen des Vorhersagefehlers
Das Buch Elemente des statistischen Lernens (online als PDF verfügbar) behandelt die optimistische Tendenz (7.21, Seite 229). Es heißt, dass der Optimismus-Bias die Differenz zwischen dem Trainingsfehler und dem In-Sample-Fehler ist (Fehler, der beobachtet wird, wenn an jedem der ursprünglichen Trainingspunkte neue Ergebniswerte abgetastet werden) (siehe unten). Als nächstes heißt …

3
Wie wird der RMSE durch den aufgerufenen Mittelwert normalisiert?
Ich habe den Root Mean Squared Error(RMSE) verwendet, um die Genauigkeit von Werten zu messen, die unter Verwendung eines Modells vorhergesagt wurden. Ich verstehe, dass der zurückgegebene Wert die Einheiten meiner Kennzahlen (anstelle eines Prozentsatzes) verwendet. Ich möchte jedoch meine Werte als Prozentsatz angeben. Der Ansatz, den ich gewählt habe, …


1
Gibt es einen akzeptierten Namen für diese Fehlermetrik?
Ich bin auf eine Fehlermetrik gestoßen, mit der der Rekonstruktionsfehler eines Modells quantifiziert wurde: wobei der te Datenpunkt ist, die Modellschätzung des ten Datenpunkts ist und der Mittelwert aller Datenpunkte ist. Der Zähler ist der quadratische Gesamtfehler des Modells, und der Nenner ist die quadratische Abweichung vom Mittelwert der Daten. …

2
Warum würde ein statistisches Modell bei einem riesigen Datensatz überanpassen?
Für mein aktuelles Projekt muss ich möglicherweise ein Modell erstellen, um das Verhalten einer bestimmten Personengruppe vorherzusagen. Der Trainingsdatensatz enthält nur 6 Variablen (ID dient nur zu Identifikationszwecken): id, age, income, gender, job category, monthly spend in dem monthly spendist die Antwortvariable. Der Trainingsdatensatz enthält jedoch ungefähr 3 Millionen Zeilen, …
8 modeling  large-data  overfitting  clustering  algorithms  error  spatial  r  regression  predictive-models  linear-model  average  measurement-error  weighted-mean  error-propagation  python  standard-error  weighted-regression  hypothesis-testing  time-series  machine-learning  self-study  arima  regression  correlation  anova  statistical-significance  excel  r  regression  distributions  statistical-significance  contingency-tables  regression  optimization  measurement-error  loss-functions  image-processing  java  panel-data  probability  conditional-probability  r  lme4-nlme  model-comparison  time-series  probability  probability  conditional-probability  logistic  multiple-regression  model-selection  r  regression  model-based-clustering  svm  feature-selection  feature-construction  time-series  forecasting  stationarity  r  distributions  bootstrap  r  distributions  estimation  maximum-likelihood  garch  references  probability  conditional-probability  regression  logistic  regression-coefficients  model-comparison  confidence-interval  r  regression  r  generalized-linear-model  outliers  robust  regression  classification  categorical-data  r  association-rules  machine-learning  distributions  posterior  likelihood  r  hypothesis-testing  normality-assumption  missing-data  convergence  expectation-maximization  regression  self-study  categorical-data  regression  simulation  regression  self-study  self-study  gamma-distribution  modeling  microarray  synthetic-data 


2
Bewertung der Qualität vorhergesagter Verteilungen
Ich habe eine Reihe von Datenpunkten wobei die unabhängigen Variablen sind, und ich glaube, dass jedes so modelliert werden kann, dass es aus einer Exponentialverteilung mit den Parametern .X.ich,yichX.ich,yichX_i, y_ixxxyichyichy_iλichλich\lambda_i Wie kann ich die Qualität meiner vorhergesagten Verteilungen in Bezug auf die Beobachtungen bewerten, wenn ich zur Vorhersage von ?X.ichX.ichX_iλichλich\lambda_iyichyichy_i …

1
Homoskedastizitätsannahme bei linearer Regression vs. Konzept studentisierter Residuen
Nachdem ich über studentisierte Residuen gelesen habe, verstehe ich nicht, wie die Idee unterschiedlicher Residuenvarianzen, die von bestimmten Werten eines Prädiktors abhängig sind (wie dies durch das Konzept studentisierter Residuen impliziert wird), nicht inhärent im Widerspruch zur Annahme der Homoskedastizität in linearen Regressionsmodellen mit einem einzigen steht Prädiktorvariable.XXX In meinem …
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.