Als «outliers» getaggte Fragen

Ein Ausreißer ist eine Beobachtung, die in Bezug auf eine einfache Charakterisierung eines Datensatzes ungewöhnlich oder nicht gut beschrieben erscheint. Eine unangenehme Möglichkeit besteht darin, dass diese Daten aus einer anderen Population stammen als die, die untersucht werden soll.



3
Warum ist die Boosting-Methode empfindlich gegenüber Ausreißern?
Ich habe viele Artikel gefunden, die besagen, dass Boosting-Methoden empfindlich gegenüber Ausreißern sind, aber keinen Artikel, der erklärt, warum. Meiner Erfahrung nach sind Ausreißer für jeden Algorithmus für maschinelles Lernen schlecht, aber warum werden Boosting-Methoden als besonders empfindlich eingestuft? Wie würden die folgenden Algorithmen in Bezug auf die Empfindlichkeit gegenüber …

4
Gute Form, um Ausreißer zu entfernen?
Ich arbeite an Statistiken für Software-Builds. Ich habe Daten für jeden Build auf Pass / Fail und abgelaufene Zeit und wir generieren ~ 200 davon / Woche. Die Erfolgsquote lässt sich leicht zusammenfassen. Ich kann sagen, dass 45% einer Woche vergangen sind. Aber ich möchte auch die verstrichene Zeit zusammenfassen …


1
Unterschiede zwischen PROC Mixed und lme / lmer in R - Freiheitsgraden
Hinweis: Diese Frage ist ein Repost, da meine vorherige Frage aus rechtlichen Gründen gelöscht werden musste. Beim Vergleich von PROC MIXED von SAS mit der Funktion lmeaus dem nlmePaket in R bin ich auf einige verwirrende Unterschiede gestoßen. Insbesondere unterscheiden sich die Freiheitsgrade in den verschiedenen Tests zwischen PROC MIXEDund …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

3
Ausreißererkennung in sehr kleinen Mengen
Ich muss einen möglichst genauen Wert für die Helligkeit einer hauptsächlich stabilen Lichtquelle bei zwölf Leuchtkraftwerten erhalten. Der Sensor ist nicht perfekt, und das Licht kann gelegentlich heller oder dunkler "flackern", was ignoriert werden kann, weshalb ich Ausreißer erkennen muss (glaube ich?). Ich habe hier einige Ansätze nachgelesen und kann …

4
Ausreißererkennung in Zeitreihen: Wie können Fehlalarme reduziert werden?
Ich versuche, die Erkennung von Ausreißern in Zeitreihen zu automatisieren, und habe eine Modifikation der hier von Rob Hyndman vorgeschlagenen Lösung verwendet . Angenommen, ich messe die täglichen Besuche einer Website aus verschiedenen Ländern. In einigen Ländern, in denen die täglichen Besuche einige Hundert oder Tausende betragen, scheint meine Methode …

1
Robuste Schätzung der Kurtosis?
Ich verwende den üblichen Schätzer für Kurtosis, , aber ich bemerke, dass selbst kleine Ausreißer in meiner empirischen Verteilung , dh kleine Spitzen weit vom Zentrum entfernt, beeinflussen es enorm. Gibt es einen Kurtosis-Schätzer, der robuster ist?K.^= μ^4σ^4K.^=μ^4σ^4\hat{K}=\frac{\hat{\mu}_4}{\hat{\sigma}^4}

2
Verallgemeinerte lineare gemischte Modelle: Diagnose
Ich habe eine zufällige logistische Intercept-Regression (aufgrund wiederholter Messungen) und möchte einige Diagnosen durchführen, insbesondere in Bezug auf Ausreißer und einflussreiche Beobachtungen. Ich habe mir die Residuen angesehen, um festzustellen, ob es Beobachtungen gibt, die auffallen. Ich würde mir aber auch gerne etwas wie Cooks Distanz oder DFFITS ansehen. Hosmer …

2
Wie genau ist IQR zur Erkennung von Ausreißern?
Ich schreibe ein Skript, das die Laufzeiten von Prozessen analysiert. Ich bin mir ihrer Verteilung nicht sicher, aber ich möchte wissen, ob ein Prozess "zu lange" läuft. Bisher habe ich 3 Standardabweichungen der letzten Laufzeiten verwendet (n> 30), aber mir wurde gesagt, dass dies nichts Nützliches bietet, wenn die Daten …

1
Automatische Funktionsauswahl zur Erkennung von Anomalien
Was ist der beste Weg, um Funktionen für die Erkennung von Anomalien automatisch auszuwählen? Ich behandle normalerweise Anomaly Detection als Algorithmus , wo die Merkmale von menschlichen Experten ausgewählt werden: was zählt , ist der Ausgangsbereich (wie in „abnormal Eingang - abnormal Ausgang“) , so auch mit vielen Funktionen , …

3
Ermitteln des durchschnittlichen GPS-Punkts
Ich muss ein Programm schreiben, um den durchschnittlichen GPS-Punkt aus einer Population von Punkten zu ermitteln. In der Praxis passiert Folgendes: Jeden Monat zeichnet eine Person einen GPS-Punkt desselben statischen Assets auf. Aufgrund der Art des GPS unterscheiden sich diese Punkte jeden Monat geringfügig. Manchmal macht die Person einen Fehler …
11 outliers  spatial 

2
Ausreißererkennung mittels Regression
Kann die Regression zur Erkennung von Lier verwendet werden? Ich verstehe, dass es Möglichkeiten gibt, ein Regressionsmodell durch Entfernen der Ausreißer zu verbessern. Das Hauptziel hierbei ist jedoch nicht, ein Regressionsmodell anzupassen, sondern mithilfe der Regression die Liers herauszufinden

6
Identifizieren von Ausreißern für nichtlineare Regression
Ich forsche auf dem Gebiet der funktionellen Reaktion von Milben. Ich möchte eine Regression durchführen, um die Parameter (Angriffsrate und Bearbeitungszeit) der Rogers Typ II-Funktion abzuschätzen. Ich habe einen Datensatz mit Messungen. Wie kann ich Ausreißer am besten bestimmen? Für meine Regression verwende ich das folgende Skript in R (eine …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.