Als «outliers» getaggte Fragen

Ein Ausreißer ist eine Beobachtung, die in Bezug auf eine einfache Charakterisierung eines Datensatzes ungewöhnlich oder nicht gut beschrieben erscheint. Eine unangenehme Möglichkeit besteht darin, dass diese Daten aus einer anderen Population stammen als die, die untersucht werden soll.

3
Gute Bücher über Datenvorverarbeitung und Techniken zur Erkennung von Ausreißern
Kennt jemand, wie der Titel schon sagt, ein gutes, aktuelles Buch, das die Datenvorverarbeitung im Allgemeinen und insbesondere Ausreißererkennungstechniken behandelt? Das Buch muss sich nicht ausschließlich darauf konzentrieren, aber es sollte sich ausführlich mit den oben genannten Themen befassen - ich würde mich nicht über etwas freuen, das ein Ausgangspunkt …


2
Anomalieerkennung: Welcher Algorithmus soll verwendet werden?
Kontext: Ich entwickle ein System, das klinische Daten analysiert, um unplausible Daten herauszufiltern, bei denen es sich möglicherweise um Tippfehler handelt. Was ich bisher gemacht habe: Um die Plausibilität zu quantifizieren, habe ich bisher versucht, die Daten zu normalisieren und dann einen Plausibilitätswert für Punkt p basierend auf seiner Entfernung …

1
Wie baue ich einen innovativen Ausreißer bei Beobachtung 48 in mein ARIMA-Modell ein?
Ich arbeite an einem Datensatz. Nachdem ich einige Modellidentifikationstechniken angewendet hatte, kam ich mit einem ARIMA (0,2,1) -Modell heraus. Ich habe die detectIOFunktion im Paket TSAin R verwendet, um bei der 48. Beobachtung meines ursprünglichen Datensatzes einen innovativen Ausreißer (IO) zu erkennen . Wie kann ich diesen Ausreißer in mein …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 


2
Einflussreiche Residuen vs. Ausreißer
Zunächst sollte ich angeben, dass ich auf dieser Website nach der Antwort gesucht habe. Entweder habe ich keine Frage gefunden, die meine Frage beantwortet hat, oder mein Wissensstand ist so niedrig, dass ich nicht bemerkt habe, dass ich die Antwort bereits gelesen habe. Ich studiere für die AP Statistics Exam. …

4
Online-Ausreißererkennung
Ich möchte automatisch segmentierte Mikroskopbilder als Teil einer Bildgebungspipeline mit hohem Durchsatz verarbeiten, um fehlerhafte Bilder und / oder fehlerhafte Segmentierungen zu erkennen. Es gibt eine Vielzahl von Parametern, die für jedes Rohbild und jede Segmentierung berechnet werden können und die "extrem" werden, wenn das Bild fehlerhaft ist. Beispielsweise führt …
10 outliers  online 

1
Unterschied zwischen Ausreißer und Inlier
Ich bin auf den Begriff Inlier in der LOF-Kennzahl (Local Outlier Factor) gestoßen. Ich bin mit dem Begriff Ausreißer vertraut (im Grunde genommen Liers - Instanzen, die sich nicht wie die übrigen Instanzen verhalten). Was bedeutet "Lieferanten" im Zusammenhang mit der Erkennung von Anomalien? und wie hängt es mit (anders …

2
Interpretation und Durchführung von Prognosen mit dem tsoutliers-Paket und auto.arima
Ich habe monatliche Daten von 1993 bis 2015 und möchte diese Daten prognostizieren. Ich habe das tsoutliers-Paket verwendet, um die Ausreißer zu erkennen, aber ich weiß nicht, wie ich mit meinen Daten weiter prognostizieren soll. Das ist mein Code: product.outlier<-tso(product,types=c("AO","LS","TC")) plot(product.outlier) Dies ist meine Ausgabe vom tsoutliers-Paket ARIMA(0,1,0)(0,0,1)[12] Coefficients: sma1 …

2
Backtesting oder Kreuzvalidierung, wenn der Modellbildungsprozess interaktiv war
Ich habe einige Vorhersagemodelle, deren Leistung ich zurücktesten möchte (dh ich nehme meinen Datensatz, spule ihn zu einem früheren Zeitpunkt zurück und sehe, wie sich das Modell prospektiv entwickelt hätte). Das Problem ist, dass einige meiner Modelle über einen interaktiven Prozess erstellt wurden. Zum Beispiel habe ich gemäß den Ratschlägen …

2
Trimmmittelwert gegen Median
Ich habe einen Datensatz mit allen Anrufen bei einem Rettungsdienst und den Reaktionszeiten der Krankenwagenabteilung. Sie gaben zu, dass es einige Fehler bei den Antwortzeiten gibt, da es Fälle gibt, in denen sie nicht mit der Aufnahme begonnen haben (der Wert ist also 0) oder in denen sie die Uhr …

1
Auswahl eines k-Werts für die LOF-Erkennungsanalyse (Local Outlier Factor)
Ich habe eine Reihe dreidimensionaler Daten und versuche, mithilfe der lokalen Ausreißerfaktoranalyse die eindeutigsten oder seltsamsten Werte zu identifizieren. Wie entscheidet man den k-Wert für die LOF-Analyse? Ich verstehe, was der k-Wert bestimmt, und bin daher nicht überrascht, dass ich mit unterschiedlichen k leicht unterschiedliche Ergebnisse sehe, aber ich bin …

6
Vorbereiten / Erstellen von Funktionen für die Erkennung von Anomalien (Netzwerksicherheitsdaten)
Mein Ziel ist es, Netzwerkprotokolle (z. B. Apache, Syslog, Active Directory-Sicherheitsüberwachung usw.) mithilfe von Clustering / Anomalieerkennung für Intrusion Detection-Zwecke zu analysieren. Aus den Protokollen habe ich viele Textfelder wie IP-Adresse, Benutzername, Hostname, Zielport, Quellport usw. (insgesamt 15-20 Felder). Ich weiß nicht, ob es einige Angriffe in den Protokollen gibt, …


1
Cooks Distanzgrenzwert
Ich habe die Entfernung des Kochs gelesen, um Ausreißer zu identifizieren, die einen großen Einfluss auf meine Regression haben. In Cooks ursprünglicher Studie sagt er, dass eine Cut-off-Rate von 1 vergleichbar sein sollte, um Influencer zu identifizieren. In verschiedenen anderen Studien wird jedoch oder als Grenzwert verwendet.4n4n\frac{4}{n}4n - k - …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.