Ich versuche, eine Metrik zum Messen der Ungleichmäßigkeit einer Verteilung für ein Experiment zu finden, das ich durchführe. Ich habe eine Zufallsvariable, die in den meisten Fällen gleichmäßig verteilt sein sollte, und ich möchte in der Lage sein, Beispiele für Datensätze zu identifizieren (und möglicherweise deren Grad zu messen), bei denen die Variable innerhalb eines bestimmten Bereichs nicht gleichmäßig verteilt ist.
Ein Beispiel für drei Datenreihen mit jeweils 10 Messungen, die die Häufigkeit des Auftretens von Messobjekten darstellen, könnte folgendermaßen aussehen:
a: [10% 11% 10% 9% 9% 11% 10% 10% 12% 8%]
b: [10% 10% 10% 8% 10% 10% 9% 9% 12% 8%]
c: [ 3% 2% 60% 2% 3% 7% 6% 5% 5% 7%] <-- non-uniform
d: [98% 97% 99% 98% 98% 96% 99% 96% 99% 98%]
Ich möchte in der Lage sein, Verteilungen wie c von solchen wie a und b zu unterscheiden und die Abweichung von c von einer Gleichverteilung zu messen. Wenn es eine Metrik für die Gleichmäßigkeit einer Verteilung gibt (Standardabweichung nahe Null?), Kann ich sie möglicherweise verwenden, um diejenigen mit hoher Varianz zu unterscheiden. Meine Daten haben jedoch möglicherweise nur einen oder zwei Ausreißer, wie im obigen Beispiel c, und ich bin nicht sicher, ob dies auf diese Weise leicht erkennbar ist.
Ich kann etwas hacken, um dies in Software zu tun, suche aber nach statistischen Methoden / Ansätzen, um dies formal zu rechtfertigen. Ich habe vor Jahren Unterricht genommen, aber Statistiken sind nicht meine Region. Dies scheint etwas zu sein, das einen bekannten Ansatz haben sollte. Tut mir leid, wenn irgendetwas davon komplett mit Knochen ist. Danke im Voraus!