Als «robust» getaggte Fragen

Robustheit im Allgemeinen bezieht sich auf die Unempfindlichkeit einer Statistik gegenüber Abweichungen von ihren zugrunde liegenden Annahmen (Huber und Ronchetti, 2009).

1
Untersuchung der Robustheit der logistischen Regression gegen die Verletzung der Linearität des Logits
Ich führe eine logistische Regression mit einem binären Ergebnis durch (Start und nicht Start). Mein Prädiktormix besteht entweder aus kontinuierlichen oder dichotomen Variablen. Bei Verwendung des Box-Tidwell-Ansatzes verstößt einer meiner kontinuierlichen Prädiktoren möglicherweise gegen die Annahme der Linearität des Logits. Aus den Statistiken zur Anpassungsgüte geht nicht hervor, dass die …


1
Sind Regressionen mit Schülerfehlern nutzlos?
Bitte bearbeiten. Wenn Sie Daten mit starken Schwänzen haben, scheint es intuitiv zu sein, eine Regression mit Schülerfehlern durchzuführen. Während ich diese Möglichkeit erkundete, stieß ich auf dieses Papier: Breusch, TS, Robertson, JC & Welsh, AH (1. November 1997). Die neue Kleidung des Kaisers: eine Kritik des multivariaten Regressionsmodells. Statistica …

1
Was bedeutet Gaußsche Effizienz?
Was bedeutet Gaußsche Effizienz bei robusten Schätzern ? Zum Beispiel hat einen Gaußschen Wirkungsgrad von 82% und einen Durchschlagspunkt von 50%.QnQnQ_{_n} Die Referenz ist: Rousseeuw PJ und Croux, C. (1993). "Alternativen zur mittleren absoluten Abweichung." J. American Statistical Assoc., 88, 1273 & ndash; 1283

1
Wann werden unsachgemäße lineare Modelle robust schön?
Fragen: Werden in der Praxis falsche lineare Modelle verwendet oder werden sie von Zeit zu Zeit in wissenschaftlichen Fachzeitschriften beschrieben? Wenn ja, in welchen Bereichen werden sie eingesetzt? Gibt es andere Beispiele für solche Modelle? Schließlich wären Standardfehler, Werte, usw., die OLS für solche Modelle entnommen wurden, korrekt oder sollten …

1
Lösung zur Ausübung von 2.2a.16 von „Robuste Statistik: Der auf Einflussfunktionen basierende Ansatz“
Auf Seite 180 von Robust Statistics: Der auf Einflussfunktionen basierende Ansatz findet sich folgende Frage: 16: Zeigen Sie, dass für ortsinvariante Schätzer immer ε∗≤12ε∗≤12\varepsilon^*\leq\frac{1}{2} . Finden Sie die entsprechende Obergrenze für den Finite-Sample-Breakdown-Punktε∗nεn∗\varepsilon^*_n , sowohl für den Fall, dassnnnungerade odernnnist. Der zweite Teil (nach dem Punkt) ist eigentlich trivial (angesichts …

2
Robuste mittlere Schätzung mit O (1) -Updateeffizienz
Ich suche eine robuste Schätzung des Mittelwerts, der eine bestimmte Eigenschaft hat. Ich habe eine Reihe von Elementen, für die ich diese Statistik berechnen möchte. Dann füge ich nacheinander neue Elemente hinzu und möchte für jedes weitere Element die Statistik neu berechnen (auch als Online-Algorithmus bezeichnet). Ich möchte, dass diese …

2
Verwenden von HAC-Standardfehlern, obwohl möglicherweise keine Autokorrelation vorliegt
Ich führe einige Regressionen durch und habe mich, da ich auf der sicheren Seite sein wollte, entschlossen, durchgehend HAC-Standardfehler (Heteroskedasticity & Autocorrelation Consistent) zu verwenden. Es kann einige Fälle geben, in denen keine serielle Korrelation vorliegt. Ist das sowieso ein gültiger Ansatz? Gibt es irgendwelche Nachteile?

1
Wie kann man den Theil-Sen-Schätzer effizient berechnen?
Der Theil-Sen-Schätzer ist für mich von Interesse, aber wenn ich ihn selbst implementiere, erhalte ich etwas, das als O (n ^ 2) skaliert. Laut Wikipedia kann es genau in O (n log (n)) berechnet werden. Kann mich jemand auf eine effiziente Implementierung hinweisen (Python oder Mathematica wären am besten, Matlab …

2
Warum würde ein statistisches Modell bei einem riesigen Datensatz überanpassen?
Für mein aktuelles Projekt muss ich möglicherweise ein Modell erstellen, um das Verhalten einer bestimmten Personengruppe vorherzusagen. Der Trainingsdatensatz enthält nur 6 Variablen (ID dient nur zu Identifikationszwecken): id, age, income, gender, job category, monthly spend in dem monthly spendist die Antwortvariable. Der Trainingsdatensatz enthält jedoch ungefähr 3 Millionen Zeilen, …
8 modeling  large-data  overfitting  clustering  algorithms  error  spatial  r  regression  predictive-models  linear-model  average  measurement-error  weighted-mean  error-propagation  python  standard-error  weighted-regression  hypothesis-testing  time-series  machine-learning  self-study  arima  regression  correlation  anova  statistical-significance  excel  r  regression  distributions  statistical-significance  contingency-tables  regression  optimization  measurement-error  loss-functions  image-processing  java  panel-data  probability  conditional-probability  r  lme4-nlme  model-comparison  time-series  probability  probability  conditional-probability  logistic  multiple-regression  model-selection  r  regression  model-based-clustering  svm  feature-selection  feature-construction  time-series  forecasting  stationarity  r  distributions  bootstrap  r  distributions  estimation  maximum-likelihood  garch  references  probability  conditional-probability  regression  logistic  regression-coefficients  model-comparison  confidence-interval  r  regression  r  generalized-linear-model  outliers  robust  regression  classification  categorical-data  r  association-rules  machine-learning  distributions  posterior  likelihood  r  hypothesis-testing  normality-assumption  missing-data  convergence  expectation-maximization  regression  self-study  categorical-data  regression  simulation  regression  self-study  self-study  gamma-distribution  modeling  microarray  synthetic-data 

1
Robuste monotone Regression in R.
Ich habe die folgende Tabelle in R df <- structure(list(x = structure(c(12458, 12633, 12692, 12830, 13369, 13455, 13458, 13515), class = "Date"), y = c(6080, 6949, 7076, 7818, 0, 0, 10765, 11153)), .Names = c("x", "y"), row.names = c("1", "2", "3", "4", "5", "6", "8", "9"), class = "data.frame") > …

3
Post-hoc-Test in einer 2x3-ANOVA mit gemischtem Design unter Verwendung von SPSS?
Ich habe zwei Gruppen von 10 Teilnehmern, die während eines Experiments dreimal bewertet wurden. Um die Unterschiede zwischen den Gruppen und zwischen den drei Bewertungen zu testen, führte ich eine 2 × 3-ANOVA mit gemischtem Design mit group(Kontrolle, experimentell), time(erste, zweite, drei) und group x time. Beides timeund groupErgebnis signifikant, …
8 anova  mixed-model  spss  post-hoc  bonferroni  time-series  unevenly-spaced-time-series  classification  normal-distribution  discriminant-analysis  probability  normal-distribution  estimation  sampling  classification  svm  terminology  pivot-table  random-generation  self-study  estimation  sampling  estimation  categorical-data  maximum-likelihood  excel  least-squares  instrumental-variables  2sls  total-least-squares  correlation  self-study  variance  unbiased-estimator  bayesian  mixed-model  ancova  statistical-significance  references  p-value  fishers-exact  probability  monte-carlo  particle-filter  logistic  predictive-models  modeling  interaction  survey  hypothesis-testing  multiple-regression  regression  variance  data-transformation  residuals  minitab  r  time-series  forecasting  arima  garch  correlation  estimation  least-squares  bias  pca  predictive-models  genetics  sem  partial-least-squares  nonparametric  ordinal-data  wilcoxon-mann-whitney  bonferroni  wilcoxon-signed-rank  traminer  regression  econometrics  standard-error  robust  misspecification  r  probability  logistic  generalized-linear-model  r-squared  effect-size  gee  ordered-logit  bayesian  classification  svm  kernel-trick  nonlinear  bayesian  pca  dimensionality-reduction  eigenvalues  probability  distributions  mathematical-statistics  estimation  nonparametric  kernel-smoothing  expected-value  filter  mse  time-series  correlation  data-visualization  clustering  estimation  predictive-models  recommender-system  sparse  hypothesis-testing  data-transformation  parametric  probability  summations  correlation  pearson-r  spearman-rho  bayesian  replicability  dimensionality-reduction  discriminant-analysis  outliers  weka 



1
Passen Sie eine robuste Regressionslinie mit einem MM-Schätzer in R an
Kontext. Ich möchte eine Regressionslinie anpassen, um die Beziehung zwischen einer Antwortvariablen und einer kontinuierlichen Kovariate . Aufgrund des Vorhandenseins schlechter Hebelpunkte habe ich mich für einen MM-Schätzer anstelle des üblichen LS-Schätzers entschieden.xyyyxxx Methodik. Grundsätzlich ist die MM-Schätzung eine M-Schätzung, die von einem S-Schätzer initialisiert wird. Daher müssen zwei Verlustfunktionen …
8 r  robust 

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.