Ich stimme zu, dass die Grafik in dem Sinne irreführend ist, dass sie angeblich zeigt, dass es keine Datenpunkte im Quadranten gibt, die kategorisch als hohe Urlaubsstimmen%, hohe% der Absolventen beschrieben werden. Was hoch und niedrig ist, wird relativ zu den Achsengrenzen, nicht zu den tatsächlichen Daten. Während es theoretisch möglich ist, eine Gemeinde mit einer Bevölkerung zu haben, die zu 100% studiert hat, gibt es eine solche Gemeinde nicht. Sie müssen keine Datenpunkte erfinden, um ein irreführendes Diagramm zu erstellen: Eine gebrochene Achse mit übertriebenen Änderungen ist ein Beispiel, das diesem nicht allzu unähnlich ist.
Eine objektivere Möglichkeit zur Visualisierung dieser Daten besteht darin, die Grenzwerte für die Streudiagrammachse auf max / min der Daten festzulegen und das Diagramm dann in Quadranten gleicher Fläche zu unterteilen.
Der Grund, warum ich mich für die gleiche Fläche von Quadranten entscheiden würde, ist, dass die Quadranten eine äquivalente lineare Beziehung zwischen Variablen aufweisen. Die kategorialen Beschreibungen der Quadranten "hoch" und "niedrig" werden als äquivalent behandelt, daher sollten auch die Bereiche gleich sein.
Wenn wir stattdessen Quadranten als eine andere Möglichkeit zur quantitativen Beschreibung von Daten verwenden möchten, können wir die Quadrantengrenzen auf den Durchschnitt jeder Variablen festlegen, wie in Datenvisualisierung mit R: 100-Beispielen gezeigt (zur Vorschau in Google Books verfügbar, S. 283,286).
Um einer Streudiagramm-Visualisierung eine weitere analytische Ebene hinzuzufügen, können Sie Farbe und Größe der Punkte verwenden. Zum Beispiel kann Farbe verwendet werden, um Universitätsstädte von den anderen zu trennen, die Wahlbeteiligung in einem Gefälle anzuzeigen oder die Ergebnisse der allgemeinen Wahlen für diese Bezirke hervorzuheben. Ich bin nicht sicher, ob die Größe bei so vielen Datenpunkten effektiv sein wird, aber Sie können möglicherweise verschiedene Bevölkerungsgruppen untersuchen, z. B. 65+, und wie sie in den Daten dargestellt werden.
Meines Erachtens gibt es auch zwei wichtige Vorbehalte, die bei der Betrachtung dieser Grafik zu beachten sind: Erstens, dass alle Absolventen gezählt werden, unabhängig davon, ob sie im Referendum abgestimmt haben oder nicht, und zweitens, dass es ansässige Absolventen mit EU-Pässen umfasst, die konnte im Referendum nicht abstimmen (vorausgesetzt, die Quelldaten basieren auf Volkszählungen).