Was ist ein "Bagplot" oder ein "bivariates Boxplot"?


11

Ich habe ein Papier gefunden, das die mehrdimensionale (hier bivariate) Version des Boxplots vorstellt - ein Bagplot. Was ist das für ein Bagplot genau? Ich kann die Reihe verschachtelter Polygone sehen, die auf Eckpunkten basieren, wobei eines dieser Polygone als Bagplot deklariert wird. Was ist die Idee des verschachtelten Polygonbaus? Welches der Polygone ist das Bagplot (zentral oder mit der durchschnittlichen Anzahl von Punkten)? Besitzen die Kanten eines Bagplots einige nützliche Eigenschaften (z. B. das spezifische Teilen der Punktmenge)?


3
Es gibt einen Artikel von Rousseeuw, Pits und Tukey in American Statistician, der diese erklärt. Ich habe aus irgendeinem Grund Probleme beim Einfügen des Links, aber Googeln von "Bagplot" und "Tukey" wird es finden
Peter Flom - Reinstate Monica

1
Fand es nur für unverschämten Preis. Immer noch am suchen.
Mbaitoff

1
Wenn Sie Zugang zu einer anständigen Bibliothek haben, sollten sie diese haben. Der amerikanische Statistiker ist ziemlich weit verbreitet. Es gab auch etwas auf Quora, aber ich habe es nicht angeschaut.
Peter Flom - Reinstate Monica

2
Rousseeuw und Ruts haben neben dem amerikanischen Statistiker einen weiteren Artikel im Postscript-Format kostenlos online .
Andy W

@AndyW, Sie als SPSS-Fellow fragen: Wie ist es Ihrer Meinung nach möglich, dies über die GPL zu tun? Wirst du den Code für uns SPSSer erfinden?
ttnphns

Antworten:


13

Hier ist ein Beispiel mit Notizen:

Hier ist der Artikel The Bagplot: A Bivariate Boxplotvon Peter J. Rousseeuw, Ida Ruts und John W. Tukey von The American Statistician: http://venus.unive.it/romanaz/ada2/bagplot.pdf

Aus der Zusammenfassung dieses Artikels:

Der „Tiefenmedian“ ist der tiefste Ort und von einem „Beutel“ umgeben, der die n / 2 Beobachtungen mit der größten Tiefe enthält. Wenn Sie den Beutel um den Faktor 3 vergrößern, erhalten Sie den „Zaun“ (der nicht eingezeichnet ist). Beobachtungen zwischen der Tasche und dem Zaun sind durch eine hellgraue Schleife gekennzeichnet, während Beobachtungen außerhalb des Zauns als Ausreißer gekennzeichnet sind. Das Bagplot visualisiert den Ort, die Ausbreitung, die Korrelation, die Schiefe und die Schwänze der Daten.

Hier ist eine Illustration der wichtigsten Teile:

Geben Sie hier die Bildbeschreibung ein

Weitere Informationen finden Sie im Folgenden:

Von der Hilfe - Dokumentation des aplpackPakets (für RBenutzer):

Ein Bagplot ist eine bivariate Verallgemeinerung des bekannten Boxplots. Es wurde von Rousseeuw, Ruts und Tukey vorgeschlagen. Im bivariaten Fall verwandelt sich die Box des Boxplots in eine konvexe Hülle, den Beutel mit dem Bagplot. In der Tasche sind 50 Prozent aller Punkte. Der Zaun trennt Punkte im Zaun von Punkten außerhalb. Es wird berechnet, indem der Beutel vergrößert wird. Die Schleife ist definiert als das konvexe Polygon, das alle Punkte innerhalb des Zauns enthält. Wenn alle Punkte auf einer geraden Linie liegen, erhalten Sie ein klassisches Boxplot. bagplot () zeichnet Bagplots, die dem in Rousseeuw et al. Anmerkungen: Der zweidimensionale Median wird angenähert. Es sind Schwierigkeiten mit kleinen Datenmengen bekannt (aber ich denke, es ist nicht ratsam, eine (grafische) Zusammenfassung von z. B. 10 Punkten zu erstellen.)

Wenn Benutzer mehrere (überlappende) Bagplots zeichnen möchten, ist es praktisch, wenn die Diagramme halbtransparent sind. Aus diesem Grund wurde dem Befehl bagplot das Transparenzflag hinzugefügt. Wenn Transparenz == TRUE ist, wird die Alpha-Ebene auf '99' (hex) gesetzt. Dies führt dazu, dass die Bagplots halbtransparent erscheinen, jedoch NUR, wenn das Ausgabegerät PDF ist und mit: pdf (file = "filename.pdf", version = "1.4") geöffnet wird. Aus diesem Grund ist die Standardeinstellung Transparenz == FALSE. Diese Funktion sowie die Argumente zur Angabe verschiedener Farben wurden von Wouter Meuleman vorgeschlagen.

Und ein Beispiel:

library(aplpack)
attach(mtcars)
bagplot(wt, mpg, xlab="Car Weight", 
        ylab="Miles Per Gallon",
        main="Bagplot Example", 
        transparency = TRUE, 
        show.whiskers = FALSE, 
        # note that data a 'fence' separates inliers from outliers, 
        # and a 'loop' indicates the points outside the bag but 
        # inside the fence. In the 'bag' are 50 percent of all 
        # points
        show.loophull = TRUE, # draw 'loop'?
        show.baghull = TRUE)  # draw 'bag'?

Geben Sie hier die Bildbeschreibung ein

verwandte Fragen:


4
Update: Jemand hat ein ggplot2-Geom dafür erstellt: gist.github.com/benmarwick/00772ccea2dd0b0f1745 . Vielleicht könnte ein unternehmungslustiger Benutzer daraus ein Paket machen?
Shadowtalker
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.