Als «residuals» getaggte Fragen

Die Residuen eines Modells sind die tatsächlichen Werte abzüglich der vorhergesagten Werte. Viele statistische Modelle treffen Annahmen über den Fehler, der durch die Residuen geschätzt wird.

3
Mittlerer quadratischer Fehler und verbleibende Quadratsumme
Ein Blick auf die Wikipedia-Definitionen von: Mittlerer quadratischer Fehler (MSE) Restsumme der Quadrate (RSS) Es sieht für mich so aus MSE=1NRSS=1N∑(fi−yi)2MSE=1NRSS=1N∑(fi−yi)2\text{MSE} = \frac{1}{N} \text{RSS} = \frac{1}{N} \sum (f_i -y_i)^2 wobei die Anzahl der Abtastwerte ist und unsere Schätzung von .NNNfifif_iyiyiy_i In keinem Wikipedia-Artikel wird dieser Zusammenhang jedoch erwähnt. Warum? Vermisse …
31 residuals  mse 


1
Können Freiheitsgrade eine nicht ganzzahlige Zahl sein?
Wenn ich GAM verwende, erhalte ich einen DF-Rest von (letzte Zeile im Code). Was bedeutet das? Über das GAM-Beispiel hinausgehend: Kann die Anzahl der Freiheitsgrade im Allgemeinen eine nicht ganzzahlige Zahl sein?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 



2
Diagnose für verallgemeinerte lineare (gemischte) Modelle (speziell Residuen)
Derzeit habe ich Probleme, das richtige Modell für schwierige Zähldaten (abhängige Variable) zu finden. Ich habe verschiedene Modelle ausprobiert (für meine Art von Daten sind Modelle mit gemischten Effekten erforderlich), z. B. lmerundlme4 (mit einer logarithmischen Transformation), sowie verallgemeinerte lineare Modelle mit gemischten Effekten mit verschiedenen Familien, z. B. Gaußscher …

5
Annahmen linearer Modelle und was zu tun ist, wenn die Residuen nicht normalverteilt sind
Ich bin ein bisschen verwirrt, was die Annahmen der linearen Regression sind. Bisher habe ich geprüft, ob: Alle erklärenden Variablen korrelierten linear mit der Antwortvariablen. (Dies war der Fall) es gab irgendeine Kollinearität zwischen den erklärenden Variablen. (Es gab wenig Kollinearität). Die Cook-Abstände der Datenpunkte meines Modells liegen unter 1 …

2
Warum ist die Normalität von Residuen für die Schätzung der Regressionsgeraden „überhaupt nicht wichtig“?
Gelman und Hill (2006) schreiben auf Seite 46, dass: Die im Allgemeinen unwichtigste Regressionsannahme ist, dass die Fehler normal verteilt sind. Tatsächlich ist für die Schätzung der Regressionsgeraden (im Vergleich zur Vorhersage einzelner Datenpunkte) die Annahme der Normalität überhaupt nicht wichtig. Im Gegensatz zu vielen Regressionslehrbüchern empfehlen wir daher keine …

1
Restdiagnostik in MCMC-basierten Regressionsmodellen
Ich habe kürzlich begonnen, Regressionsmischmodelle im Bayes'schen Rahmen unter Verwendung eines MCMC-Algorithmus (Funktion MCMCglmm in R) anzupassen. Ich glaube, ich habe verstanden, wie man die Konvergenz des Schätzprozesses diagnostiziert (Kurve, Geweke-Plot, Autokorrelation, posteriore Verteilung ...). Eines der Dinge, die mir im Bayes'schen Rahmen auffallen, ist, dass viel Aufwand für diese …

2
Woher kommt in der einfachen linearen Regression die Formel für die Varianz der Residuen?
Nach einem von mir verwendeten Text lautet die Formel für die Varianz des ithithi^{th} -Rests wie folgt: σ2(1−1n−(xi−x¯¯¯)2Sxx)σ2(1−1n−(xi−x¯)2Sxx)\sigma^2\left ( 1-\frac{1}{n}-\frac{(x_{i}-\overline{x})^2}{S_{xx}} \right ) Das finde ich schwer zu glauben , da die ithithi^{th} Rest die Differenz zwischen dem ist ithithi^{th} beobachteten Wert und dem ithithi^{th} ausgestattet Wert; Wenn man die Varianz …

2
Wie funktionieren Engpassarchitekturen in neuronalen Netzwerken?
Wir definieren eine Engpassarchitektur als den Typ, der im ResNet-Artikel zu finden ist, in dem [zwei 3x3-Conv-Ebenen] durch [eine 1x1- Conv-Ebene , eine 3x3-Conv-Ebene und eine weitere 1x1-Conv-Ebene] ersetzt werden. Ich verstehe, dass die 1x1-Conv-Ebenen als eine Form der Dimensionsreduktion (und Wiederherstellung) verwendet werden, die in einem anderen Beitrag erläutert …

1
Sandwich Estimator Intuition
Wikipedia und die Vignette des R-Sandwich-Pakets geben gute Informationen über die Annahmen, die OLS-Koeffizienten-Standardfehler stützen, und den mathematischen Hintergrund der Sandwich-Schätzer. Ich bin mir immer noch nicht sicher, wie das Problem der heteroskedastischen Residuen angegangen wird, wahrscheinlich, weil ich die Standard-Varianzschätzung der OLS-Koeffizienten überhaupt nicht vollständig verstehe. Was ist die …

2
Residuendiagramme: Warum Diagramm gegen angepasste Werte, nicht beobachtete Werte?
Im Zusammenhang mit der OLS-Regression verstehe ich, dass ein Residuendiagramm (gegen angepasste Werte) herkömmlicherweise betrachtet wird, um auf konstante Varianz zu testen und die Modellspezifikation zu bewerten. Warum werden die Residuen gegen die Anpassungen und nicht gegen die Werte aufgetragen ? Inwiefern unterscheiden sich die Informationen von diesen beiden Darstellungen?Y.Y.Y …



Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.