Für welche (symmetrischen) Verteilungen ist der Stichprobenmittelwert ein effizienterer Schätzer als der Stichprobenmedian?


17

Ich habe unter der Annahme gearbeitet, dass der Stichprobenmedian ein robusteres Maß für die zentrale Tendenz ist als der Stichprobenmittelwert, da er Ausreißer ignoriert. Ich war daher überrascht zu erfahren (in der Antwort auf eine andere Frage ), dass für Stichproben, die aus einer Normalverteilung gezogen wurden, die Varianz des Stichprobenmittelwerts geringer ist als die Varianz des Stichprobenmedians (zumindest für großes ).n

Ich verstehe mathematisch, warum das so ist. Gibt es eine "philosophische" Sichtweise, die der Intuition hilft, wann der Median verwendet werden soll und nicht der Mittelwert für andere Verteilungen?

Gibt es mathematische Werkzeuge, mit denen die Frage für eine bestimmte Distribution schnell beantwortet werden kann?

Antworten:


20

Nehmen wir an, wir beschränken die Betrachtung auf symmetrische Verteilungen, bei denen der Mittelwert und die Varianz endlich sind (so wird beispielsweise der Cauchy von der Betrachtung ausgeschlossen).

Außerdem beschränke ich mich anfangs auf unimodale Fälle und meistens auf "nette" Situationen (obwohl ich später zurückkommen und einige andere Fälle besprechen könnte).

Die relative Varianz hängt von der Stichprobengröße ab. Es ist üblich, das Verhältnis der ( fachen) asymptotischen Varianzen zu diskutieren , wir sollten jedoch berücksichtigen, dass die Situation bei kleineren Stichprobengrößen etwas anders sein wird. (Der Medianwert ist manchmal merklich besser oder schlechter als es sein asymptotisches Verhalten vermuten lässt. Beispielsweise hat er im Normalfall mit einen Wirkungsgrad von etwa 74% anstatt 63%. Das asymptotische Verhalten ist im Allgemeinen ein guter Anhaltspunkt für ein recht mäßiges Verhalten Stichprobengröße.)nn=3

Die Asymptoten sind relativ leicht zu handhaben:

Mittelwert: Varianz = σ 2 .n×σ2

Median : Varianz = 1n× wobeif(m)die Höhe der Dichte im Median ist.1[4f(m)2]f(m)

Also, wenn ist der Median asymptotisch effizienter.f(m)>12σ

[Im Normalfall ist , also1f(m)=12πσ , woher die asymptotische relative Effizienz von2/π)]1[4f(m)2]=πσ222/π

Wir können sehen, dass die Varianz des Medians vom Verhalten der Dichte in der Nähe des Zentrums abhängt, während die Varianz des Mittelwerts von der Varianz der ursprünglichen Verteilung abhängt (die in gewissem Sinne von der Dichte überall beeinflusst wird und in insbesondere eher so, wie es sich weiter vom Zentrum entfernt verhält)

Das heißt, während der Median weniger von Ausreißern als vom Mittelwert betroffen ist und wir häufig feststellen, dass er eine geringere Varianz aufweist als der Mittelwert, wenn die Verteilung stark schwanzförmig ist (wodurch mehr Ausreißer erzeugt werden), was die Leistung des Medians tatsächlich beeinflusst Median ist inliers . Es kommt oft vor, dass (für eine feste Varianz) die Tendenz besteht, dass beide zusammengehen.

σ2σ2

In vielen Fällen ist der Median oft "besser" als der Mittelwert, wenn der Schwanz schwer ist (wir müssen jedoch berücksichtigen, dass es relativ einfach ist, Gegenbeispiele zu konstruieren). Wir können also einige Fälle betrachten, die uns zeigen, was wir oft sehen, aber wir sollten nicht zu viel in sie hineinlesen, da ein schwerer Schwanz nicht allgemein mit einem höheren Peak einhergeht.

n

Was ist mit einer logistischen Verteilung, die wie die normale Verteilung ungefähr parabolisch um das Zentrum verläuft, jedoch schwerere Schwänze aufweist (wenn ?x

π2/314f(m)2=4π2/120.82

Betrachten wir zwei andere Dichten mit exponentiell ähnlichen Schwänzen, aber unterschiedlicher Höhe.

sech12n=5

Hier können wir sehen, wie sich die Höhe im Median erhöht, wenn wir diese drei Dichten durchlaufen (Varianz konstant halten):

Bildbeschreibung hier eingeben

1212

Wenn wir die Verteilung für eine gegebene Varianz noch spitzer machen (vielleicht indem wir den Schwanz schwerer als exponentiell machen), kann der Median noch weitaus effizienter (relativ gesehen) sein. Es gibt wirklich keine Grenze, wie hoch dieser Gipfel sein kann.

ν=5

...

Bei endlichen Stichprobengrößen ist es manchmal möglich, die Varianz der Verteilung des Medians explizit zu berechnen. Wo dies nicht machbar oder nur unpraktisch ist, können wir mithilfe der Simulation die Varianz des Medians (oder das Verhältnis der Varianz *) über zufällige Stichproben berechnen, die aus der Verteilung gezogen wurden (was ich getan habe, um die kleinen Stichprobenwerte oben zu erhalten) ).

* Auch wenn wir die Varianz des Mittelwerts oftmals nicht benötigen, da wir sie berechnen können, wenn wir die Varianz der Verteilung kennen, ist dies möglicherweise recheneffizienter, da sie wie eine Kontrollvariable (der Mittelwert) wirkt und Median sind oft ziemlich korreliert).


1

f(x)=12e|xμ|,<x<
μX1,X2,,Xn2/n14nf(μ)2=14n/4=1/n<2/n

σ2=11/nn14n(1/2π)2=π2n1.57/n>1/n

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.