Ich versuche, die Erkennung von Ausreißern in Zeitreihen zu automatisieren, und habe eine Modifikation der hier von Rob Hyndman vorgeschlagenen Lösung verwendet .
Angenommen, ich messe die täglichen Besuche einer Website aus verschiedenen Ländern. In einigen Ländern, in denen die täglichen Besuche einige Hundert oder Tausende betragen, scheint meine Methode vernünftig zu funktionieren.
In Fällen, in denen ein Land nur zu 1 oder 2 Besuchen pro Tag führt, sind die Grenzen des Algorithmus jedoch sehr eng (z. B. 1 ± 0,001), und daher werden die 2 Besuche als Ausreißer betrachtet. Wie kann ich solche Fälle automatisch erkennen und wie kann ich sie behandeln, um Ausreißer zu identifizieren? Ich möchte keinen manuellen Schwellenwert von beispielsweise 100 Besuchen pro Tag festlegen.
Vielen Dank!