Gegenbeispiele, bei denen der Median außerhalb von [Mode-Mean] liegt


11

Dieser Artikel steht über meiner Liga, aber er spricht über ein Thema, das mich interessiert, die Beziehung zwischen Mittelwert, Modus und Median. Es sagt :

Es wird allgemein angenommen, dass der Median einer unimodalen Verteilung "normalerweise" zwischen dem Mittelwert und dem Modus liegt. Dies ist jedoch nicht immer wahr ...

Meine Frage : Kann jemand Beispiele für kontinuierliche unimodale (idealerweise einfache) Verteilungen liefern, bei denen der Median außerhalb des Intervalls [Modus, Mittelwert] liegt? Zum Beispiel eine Distribution wie mode < mean < median.

=== EDIT =======

Es gibt bereits gute Antworten von Glen_b und Francis, aber mir wurde klar, dass ich wirklich an einem Beispiel interessiert bin, bei dem Modus <Mittelwert <Median oder Median <Mittelwert <Modus (dh Median liegt außerhalb von [Modus, Mittelwert] UND Median ist) "auf derselben Seite" als Mittelwert des Modus (dh sowohl über als auch unter dem Modus)). Ich kann die Antworten hier akzeptieren, wenn eine neue Frage offen ist oder kann jemand hier direkt eine Lösung vorschlagen?


Es ist kein Problem, die Antwort auf den eingeschränkteren Fall auszudehnen.
Glen_b -Reinstate Monica

2
Schauen Sie sich Abbildung 6 hier an: ww2.amstat.org/publications/jse/v13n2/vonhippel.html, die ein (kontinuierliches unimodales) Weibull-Beispiel liefert, bei dem der Median nicht zwischen Modus und Mittelwert liegt.
Matthew Towers

Antworten:


14

Sicher, es ist nicht schwer, Beispiele zu finden - auch kontinuierliche unimodale -, bei denen der Median nicht zwischen dem Mittelwert und dem Modus liegt.

  1. Man betrachte iid aus einer Dreiecksverteilung der Form f T ( t ) = 2 ( 1 - t ) 1 0 < t < 1T1,T2fT(t)=2(1t)10<t<1

    Nun sei eine 60-40 Mischung aus T 1 und - 4 T 2 .XT14T2

    Die Dichte von sieht folgendermaßen aus:X

    Mischung zweier dreieckiger Dichten mit dem Median außerhalb des Modenmittelintervalls

    Der Mittelwert liegt unter 0, der Modus liegt bei 0, aber der Median liegt über 0. Eine geringfügige Änderung würde ein Beispiel ergeben, bei dem sogar die Dichte (und nicht nur das PDF) kontinuierlich war, die Beziehung zwischen den Standortmaßen jedoch das gleiche (bearbeiten: siehe 3. unten).

  2. Verallgemeinern wir, setzen wir einen Anteil (mit 0 < p < 1 ) der Gesamtwahrscheinlichkeit in das rechte Dreieck und einen Anteil ( 1 - p ) in das linke Dreieck (anstelle von 0,6 und 0,4) wir hatten vorher). Stellen Sie außerdem den Skalierungsfaktor für die linke Hälfte - β anstelle von - 4 (mit β > 0 ) ein:p0<p<1(1p)β4β>0

    Dichte für die verallgemeinerte Version dieser Mischung aus zwei dreieckigen Dichten

    Nehmen wir nun befindet sich der Median immer in dem Intervall, das vom rechtwinkligen Dreieck abgedeckt wird, sodass der Median den Modus überschreitet (der immer bei0bleibt). Insbesondere wennp>1p>120 liegt der Median bei1-1/p>12 .11/2p

    Der Mittelwert liegt bei .(pβ(1p))/3

    Wenn ist, liegt der Mittelwert unter dem Modus, und wenn β < p / ( 1 - p ) liegt, liegt der Mittelwert über dem Modus.β>p/(1p)β<p/(1p)

    Andererseits wollen wir , um den Mittelwert unter dem Median zu halten.(pβ(1p))/3<11/2p

    Betrachten Sie ; Dadurch wird der Median über dem Modus angezeigt.p=0.7

    Dann würde β < p / ( 1 - p ) erfüllen, so dass der Mittelwert über dem Modus liegt.β=2β<p/(1p)

    Der Median liegt tatsächlich bei während der Mittelwert bei 0,7 - 2 ( 0,3 ) liegt11/1.40,1548. Daherhaben wirfürp=0,7undβ=2 denModus <Mittelwert <Median.0.72(0,3)30,0333p=0,7β=2

    (NB Aus Gründen der Übereinstimmung mit meiner Notation sollte die Variable auf der x-Achse für beide Diagramme statt t sein, aber ich werde nicht zurückgehen und sie korrigieren.)xt

  3. Dies ist ein Beispiel, bei dem die Dichte selbst kontinuierlich ist. Es basiert auf dem Ansatz in 1. und 2. oben, wobei jedoch der "Sprung" durch eine steile Steigung ersetzt wurde (und dann die gesamte Dichte um 0 gedreht wurde, weil ich ein Beispiel möchte, das rechtwinklig aussieht).

    kontinuierliche, stückweise lineare Dichte mit Median <Mittelwert <-Modus

    [Unter Verwendung des Ansatzes "Mischung dreieckiger Dichten" kann es als Mischung von 3 unabhängigen skalierten Variablen der in Abschnitt 1 beschriebenen dreieckigen Form erzeugt werden. Wir haben jetzt 15% , 60% - 3 T 2 und 25% 5 T 3. ]T13T25T3

    Wie wir im obigen Diagramm sehen, liegt der Mittelwert wie gewünscht in der Mitte.


  1. Beachten Sie, dass m_t_ den Weibull in Kommentaren erwähnt (für die der Median außerhalb des Intervalls für einen kleinen Bereich des Formparameters k liegt ). Dies ist möglicherweise zufriedenstellend, da es sich um eine bekannte unimodale kontinuierliche (und reibungslose) Verteilung mit einfacher funktionaler Form handelt.[mode,mean]k

    Insbesondere für kleine Werte des Weibull-Formparameters ist die Verteilung rechtwinklig, und wir haben die übliche Situation des Medians zwischen dem Modus und dem Mittelwert, während für große Werte des Weibull-Formparameters die Verteilung linksversetzt ist und wir haben wieder diese "Median in der Mitte" -Situation (aber jetzt mit dem Modus rechts und nicht mit dem Mittelwert). Dazwischen befindet sich eine kleine Region, in der der Median außerhalb des Mittelwert-Intervalls liegt, und in der Mitte kreuzen sich Mittelwert und Modus:

          k                 order
     (0,3.2589)      mode < median < mean
      ≈ 3.2589       mode = median < mean
    (3.2589,3.3125)  median < mode < mean    (1)
      ≈ 3.3215       median < mode = mean
    (3.3215,3.4395)  median < mean < mode    (2)
      ≈ 3.4395       median = mean < mode
      3.4395+        mean < median < mode
      (≈3.60235      moment-skewness = 0)
    

    Wenn wir in den oben mit (1) und (2) gekennzeichneten Intervallen geeignete Werte für den Formparameter auswählen - solche, bei denen die Lücken zwischen den Standortstatistiken ungefähr gleich sind - erhalten wir:

    Weibull-Dichten mit Median außerhalb des Modenmittelwertintervalls

    Obwohl diese die Anforderungen erfüllen, sind die drei Standortparameter leider so nahe beieinander, dass wir sie visuell nicht unterscheiden können (sie fallen alle in dasselbe Pixel), was ein wenig enttäuschend ist - die Fälle für meine früheren Beispiele sind viel mehr getrennt. (Dennoch schlägt es Situationen vor, die mit anderen Verteilungen untersucht werden sollten, von denen einige Ergebnisse ergeben könnten, die visuell unterschiedlicher sind.)


Das funktioniert, danke. Was wäre aus Neugier eine ähnliche "Dreiecksverteilung", bei der Modus <Mittelwert <Median? (hier Median <Modus <Mittelwert)
Janthelme

- -4T.21.25T20,60,4

6

Das folgende Beispiel stammt aus Jordan Stoyanovs Gegenbeispielen zur Wahrscheinlichkeit .

cλX.

f(x)={ce- -λ(x- -c),x(c,)x,x(0,c]]0,x(- -,0]].
μmM.X.
μ=c33+c2λ+cλ2,m=1,M.=c.
f(x)
c22+cλ=1.
c1λ2c>111.0001μ>cM.=cmμM.

0

Nehmen Sie die Exponentialverteilung mit dem Ratenparameter a und der Dichte a exp (-ax) für 0 <= x <unendlich. Der Modus ist bei Null. Natürlich sind der Mittelwert und der Median größer als 0. Das cdf ist 1-exp (-ax). Also für den Median lösen Sie für exp (-ax) = 0,5 für x. Dann ist -ax = ln (0,5) oder x = -ln (0,5) / a. Integrieren Sie für den Mittelwert ax exp (-ax) von 0 bis unendlich. Nehmen Sie a = 1 und wir haben einen Median = -ln (0,5) = ln (2) und einen Mittelwert = 1.

Also Modus <Median <Mittelwert.


1
Entschuldigung, aber suchen wir nicht nach Verteilungen, bei denen der Modus <Mittelwert <Median ist (oder allgemeiner, wenn der Median außerhalb von [Modus, Durchschnitt] liegt)?
Janthelme

3
Entschuldigen Sie die Verwirrung, die ich der ursprünglichen Frage hinzugefügt habe, aber ich habe ursprünglich nach Beispielen gefragt, bei denen der Median außerhalb von [Modus, Mittelwert] liegt, während ich denke, dass der Median in Ihrem Beispiel innerhalb von [Modus, Median] liegt.
Janthelme

3
Michael, die Frage fragt nicht nach einem Fall, in dem der Median zwischen dem Modus und dem Mittelwert liegt. Sie zitieren das Original in Ihrem Kommentar direkt über diesem falsch. Die Frage lautet nicht "Modus <Median <Mittelwert", wo Sie angeben, dass dies der Fall ist (und dies zu keinem Zeitpunkt im Bearbeitungsverlauf getan hat). Infolgedessen liefert Ihre Antwort einen Fall, nach dem nicht gefragt wird. in der Tat ist dies die übliche Situation (Median in der Mitte der beiden anderen), von der die Frage Ausnahmen sucht. Fast jede bekannte unimodale Verteilung hat den Median in der Mitte - der Trick besteht darin, diejenigen zu finden, die das nicht tun.
Glen_b -State Monica

1
Der Bearbeitungsverlauf ist verfügbar, indem Sie auf den roten Link am Ende der Frage klicken, auf dem derzeit "Vor 18 Stunden bearbeitet" steht (er wurde während der Eingabe dieser Kommentare auf 19 geändert). Sie können den Verlauf der Änderungen anzeigen, indem Sie dort klicken. Die Frage wurde vor 22 Stunden veröffentlicht (während ich dies jetzt tippe). Wenn Sie sich durch den Bearbeitungsverlauf klicken, wird die ursprüngliche Frage unten mit der Bezeichnung "1" angezeigt. Ihre Antwort erschien ungefähr 2 Stunden später (vor 20 Stunden), als die Frage dies noch sagte. Ungefähr 1-2 Stunden nach Ihrem Beitrag hat das OP seine Frage einmal bearbeitet, was zu sehen ist ...
Glen_b - Monica

1
ctd ... oben im Bearbeitungsverlauf .. Nach jeder Bearbeitung gibt es ein zweiminütiges Fenster, in dem Sie Änderungen vornehmen können, die als Teil dieser Bearbeitung gelten (dh vor 22 Stunden und vor 18 bis 19 Stunden gab es zwei). Minutenfenster jedes Mal, wenn beispielsweise ein Tippfehler behoben wurde), aber vor ~ 20 Stunden, als Sie gepostet haben, war die Frage etwa 2 Stunden lang unverändert geblieben, und sie blieb nach dem Posten mehr als eine Stunde lang unverändert, als eine größere Bearbeitung durchgeführt wurde ( im Bearbeitungsverlauf angezeigt) wurde durchgeführt. Alle Änderungen außerhalb dieser kurzen zweiminütigen Nachbearbeitungsfenster befinden sich im Bearbeitungsverlauf.
Glen_b -State Monica
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.