Der übliche Ansatz zur Schätzung der Parameter einer Normalverteilung besteht darin, den Mittelwert und die Standardabweichung / Varianz der Stichprobe zu verwenden.
Wenn es jedoch einige Ausreißer gibt, sollten der Median und die mediane Abweichung vom Median viel robuster sein, oder?
Bei einigen Datensätzen, die ich ausprobiert habe, scheint die durch geschätzte Normalverteilung viel zu ergeben Besser geeignet als das klassische Verwendung des Mittelwerts und der RMS-Abweichung.
Gibt es einen Grund, den Median nicht zu verwenden, wenn Sie davon ausgehen, dass der Datensatz einige Ausreißer enthält? Kennen Sie eine Referenz für diesen Ansatz? Bei einer schnellen Suche in Google wurden keine nützlichen Ergebnisse gefunden, in denen die Vorteile der Verwendung von Medianen erläutert werden (der "Median für die Schätzung von Normalverteilungsparametern" ist jedoch offensichtlich kein sehr spezifischer Satz von Suchbegriffen).
Ist die mittlere Abweichung voreingenommen? Soll ich es mit multiplizieren , um die Verzerrung zu verringern?
Kennen Sie ähnliche robuste Parameterschätzungsansätze für andere Verteilungen, wie die Gamma-Verteilung oder die exponentiell modifizierte Gauß-Verteilung (die eine Schiefe bei der Parameterschätzung erfordert, und Ausreißer vermasseln diesen Wert wirklich)?