Ich versuche, Canopy-Clustering zu verwenden, um erste Cluster für KMeans in Mahout bereitzustellen.
Gibt es eine Möglichkeit, die Werte der Abstandsschwellen T1 & T2 algorithmisch zu bestimmen / zu approximieren? Im Moment habe ich T1 = 100 und T2 = 1, was anscheinend nichts Gutes bringt.