Ich habe mehrere Verteilungen (10 Verteilungen in der Abbildung unten). 
Tatsächlich handelt es sich um Histogramme: Auf der x-Achse gibt es 70 Werte, die die Größe einiger Partikel in einer Lösung darstellen, und für jeden Wert von x ist der entsprechende Wert von y der Anteil der Partikel, deren Größe um den Wert von x liegt.
Ich möchte diese Distributionen gruppieren. Derzeit verwende ich zum Beispiel ein hierarchisches Clustering mit dem euklidischen Abstand. Ich bin mit der Wahl der Entfernung nicht zufrieden. Ich habe eine informationstheoretische Distanz wie Kullback-Leibler ausprobiert, aber die Daten enthalten viele Nullen, was zu Schwierigkeiten führt. Haben Sie einen Vorschlag für eine angemessene Entfernung und / oder eine andere Clustering-Methode?
