Ich arbeite an der Erstellung einer Website, auf der die Volkszählungsdaten für ein vom Benutzer ausgewähltes Polygon angezeigt werden und die Verteilung der verschiedenen Parameter grafisch dargestellt werden soll (ein Diagramm pro Parameter).
Die Daten haben normalerweise die folgenden Eigenschaften:
- Die Stichprobengröße ist in der Regel groß (etwa 10.000 Datenpunkte).
- Der Wertebereich ist in der Regel sehr groß (z. B. kann die Mindestbevölkerung weniger als 100 und die Höchstbevölkerung etwa 500.000 betragen).
- q1 liegt normalerweise in der Nähe des Minimums (etwa 200), während q2 und q3 innerhalb von 10.000 liegen
- Es sieht nicht nach einer Normalverteilung aus
Ich bin kein Statistiker und daher ist meine Beschreibung möglicherweise nicht genau klar.
Ich möchte diese Verteilung in einer Grafik darstellen, die von den Bürgern gesehen wird (der Laie, wenn Sie möchten).
Am liebsten hätte ich ein Histogramm verwendet, aber es ist aufgrund des großen Wertebereichs nicht möglich, weshalb das Herstellen von Behältern nicht wirklich einfach und unkompliziert ist.
Ausgehend von dem, was ich über Statistiken weiß, wird häufig ein Box-Plot verwendet, um diese Art von Daten anzuzeigen. Für einen Laien ist das Entschlüsseln des Box-Plots jedoch nicht einfach.
Welche Möglichkeiten habe ich, um diese Daten leicht verständlich darzustellen?