Als «outliers» getaggte Fragen

Ein Ausreißer ist eine Beobachtung, die in Bezug auf eine einfache Charakterisierung eines Datensatzes ungewöhnlich oder nicht gut beschrieben erscheint. Eine unangenehme Möglichkeit besteht darin, dass diese Daten aus einer anderen Population stammen als die, die untersucht werden soll.


6
Tests zur Überprüfung grundlegender Daten
In meiner beruflichen Tätigkeit arbeite ich oft mit Datensätzen anderer Personen, Nicht-Experten bringen mir klinische Daten und ich helfe ihnen, diese zusammenzufassen und statistische Tests durchzuführen. Das Problem, das ich habe, ist, dass die Datensätze, die ich mitbringe, fast immer mit Tippfehlern, Inkonsistenzen und allen möglichen anderen Problemen durchsetzt sind. …

1
Plot.lm () interpretieren
Ich hatte eine Frage zur Interpretation der durch plot (lm) in R erzeugten Graphen. Ich habe mich gefragt, ob Sie mir sagen können, wie die Diagramme für die Skalenposition und die Hebelwirkung für die verbleibenden Graphen zu interpretieren sind. Über Kommentare würde ich mich freuen. Grundkenntnisse in Statistik, Regression und …

14
Einfacher Algorithmus zur Online-Ausreißererkennung einer generischen Zeitreihe
Ich arbeite mit einer großen Anzahl von Zeitreihen. Bei diesen Zeitreihen handelt es sich im Grunde genommen um Netzwerkmessungen, die alle 10 Minuten durchgeführt werden. Einige davon sind periodisch (dh die Bandbreite), andere nicht (dh die Menge des Routingverkehrs). Ich hätte gerne einen einfachen Algorithmus für eine Online- "Ausreißererkennung". Grundsätzlich …

14
Warum haben robuste (und widerstandsfähige) Statistiken die klassischen Techniken nicht ersetzt?
Bei der Lösung von Geschäftsproblemen mithilfe von Daten wird häufig davon ausgegangen, dass mindestens eine der Annahmen, die die klassischen Statistiken untermauern, ungültig ist. Meistens stört sich niemand daran, diese Annahmen zu überprüfen, so dass Sie es nie wirklich wissen. Zum Beispiel ist die Tatsache, dass so viele der gängigen …

3
Ein Beispiel: LASSO-Regression unter Verwendung von glmnet für binäre Ergebnisse
Ich beginne mit der Verwendung von dabble glmnetmit LASSO Regression , wo mein Ergebnis von Interesse dichotomous ist. Ich habe unten einen kleinen nachgebildeten Datenrahmen erstellt: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 


8
Generieren Sie eine Zufallsvariable mit einer definierten Korrelation zu einer oder mehreren vorhandenen Variablen.
Für eine Simulationsstudie muss ich Zufallsvariablen generieren, die eine vorab festgelegte (Populations-) Korrelation zu einer vorhandenen Variablen .Y.YY Ich sah in die RPakete copulaund CDVineder Zufall multivariate Verteilungen mit einer bestimmten Abhängigkeitsstruktur erzeugen kann. Es ist jedoch nicht möglich, eine der resultierenden Variablen an eine vorhandene Variable zu binden. Anregungen …


8
Rigorose Definition eines Ausreißers?
In der Statistik wird oft vom Umgang mit Ausreißern gesprochen. Was mich daran stört, ist, dass die Definition eines Ausreißers, soweit ich das beurteilen kann, völlig subjektiv ist. Wenn beispielsweise die tatsächliche Verteilung einer Zufallsvariablen sehr stark oder bimodal ist, werden durch eine Standardvisualisierung oder eine Zusammenfassungsstatistik zum Erkennen von …

1
Ermitteln von Ausreißern in Zeitreihen (LS / AO / TC) mithilfe des Pakets tsoutliers in R. Wie werden Ausreißer im Gleichungsformat dargestellt?
Kommentar: Zunächst möchte ich dem Autor des neuen tsoutliers- Pakets, das Chen und Lius Zeitreihen-Ausreißererkennung implementiert , ein großes Dankeschön aussprechen , das 1993 im Journal of the American Statistical Association in Open Source Software .RRR Das Paket erkennt 5 verschiedene Ausreißertypen iterativ in Zeitreihendaten: Additiver Ausreißer (AO) Innovationsausreißer (IO) …

8
Ist es in Ordnung, Ausreißer aus Daten zu entfernen?
Ich habe nach einer Möglichkeit gesucht, Ausreißer aus einem Datensatz zu entfernen, und diese Frage gefunden . In einigen Kommentaren und Antworten auf diese Frage wurde jedoch darauf hingewiesen, dass es keine gute Praxis ist, Ausreißer aus den Daten zu entfernen. In meinem Datensatz habe ich mehrere Ausreißer, die sehr …
33 outliers 

3
Wie reagieren Zufallswälder nicht auf Ausreißer?
In einigen Quellen, einschließlich dieser , habe ich gelesen , dass Random Forests unempfindlich gegenüber Ausreißern sind (wie es beispielsweise bei Logistic Regression und anderen ML-Methoden der Fall ist). Zwei Teile der Intuition sagen mir jedoch etwas anderes: Bei jeder Erstellung eines Entscheidungsbaums müssen alle Punkte klassifiziert werden. Dies bedeutet, …


8
Ausreißer durch Mittelwert ersetzen
Diese Frage wurde von meinem Freund gestellt, der nicht mit dem Internet vertraut ist. Ich habe keinen statistischen Hintergrund und habe im Internet nach dieser Frage gesucht. Die Frage ist: Ist es möglich, Ausreißer durch Mittelwerte zu ersetzen? Wenn es möglich ist, gibt es Buchreferenzen / Zeitschriften, um diese Aussage …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.