Ich habe einen Vektor und möchte darin Ausreißer erkennen.
Die folgende Abbildung zeigt die Verteilung des Vektors. Rote Punkte sind Ausreißer. Blaue Punkte sind normale Punkte. Gelbe Punkte sind ebenfalls normal.
Ich benötige eine Ausreißererkennungsmethode (eine nicht parametrische Methode), mit der nur rote Punkte als Ausreißer erkannt werden können. Ich habe einige Methoden wie IQR und Standardabweichung getestet, aber sie erkennen auch gelbe Punkte als Ausreißer.
Ich weiß, dass es schwierig ist, nur den roten Punkt zu erkennen, aber ich denke, es sollte einen Weg (sogar eine Kombination von Methoden) geben, um dieses Problem zu lösen.
Punkte sind Messwerte eines Sensors für einen Tag. Die Werte des Sensors ändern sich jedoch aufgrund der Neukonfiguration des Systems (die Umgebung ist nicht statisch). Die Zeiten der Neukonfigurationen sind unbekannt. Blaue Punkte gelten für den Zeitraum vor der Neukonfiguration. Gelbe Punkte stehen für nach der Neukonfiguration, was zu Abweichungen in der Verteilung der Messwerte führt (sind jedoch normal). Rote Punkte sind das Ergebnis einer illegalen Änderung der gelben Punkte. Mit anderen Worten, es handelt sich um Anomalien, die erkannt werden sollten.
Ich frage mich, ob die Schätzung der Kernel-Glättungsfunktion ('pdf', 'Survivor', 'cdf' usw.) Abhilfe schaffen könnte oder nicht. Würde jemand über die Hauptfunktionalität (oder andere Glättungsmethoden) und die Rechtfertigung für die Verwendung in einem Kontext zur Lösung eines Problems helfen?