Ich habe ein ähnliches Problem wie die hier gestellte Frage:
Wie misst man die Ungleichmäßigkeit einer Verteilung?
Ich habe eine Reihe von Wahrscheinlichkeitsverteilungen über die Wochentage. Ich möchte messen, wie nahe jede Verteilung an (1 / 7,1 / 7, ..., 1/7) liegt.
Im Moment verwende ich eine Antwort aus der obigen Frage; eine L2-Norm, die den Wert 1 hat, wenn die Verteilung für einen der Tage die Masse 1 hat und für (1 / 7,1 / 7, ..., 1/7) minimiert ist. Ich skaliere dies linear, so dass es zwischen 0 und 1 liegt, und drehe es dann um, sodass 0 vollkommen ungleichmäßig und 1 vollkommen gleichförmig bedeutet.
Das funktioniert ziemlich gut, aber ich habe ein Problem damit; Jeder Wochentag wird als Dimension im 7-Dim-Raum gleich behandelt, sodass die Nähe der Tage nicht berücksichtigt wird. Mit anderen Worten, es gibt die gleiche Punktzahl für (1 / 2,1 / 2,0,0,0,0,0) und (1 / 2,0,0,1 / 2,0,0,0) gerade obwohl in gewissem Sinne letzteres "ausgebreiteter" und einheitlicher ist und idealerweise eine höhere Punktzahl erzielen sollte. Es gibt offensichtlich die zusätzliche Komplikation, dass die Reihenfolge der Tage zirkulär ist.
Wie kann ich diese Heuristik ändern, um die Nähe der Tage zu berücksichtigen?