Kann mir jemand die Faktoren, die den Speicherbedarf von Means-Clustering beeinflussen, mit ein wenig Erklärung erklären?
Kann mir jemand die Faktoren, die den Speicherbedarf von Means-Clustering beeinflussen, mit ein wenig Erklärung erklären?
Antworten:
Algorithmen wie Lloyds können nur mit Gleitkommawerten implementiert werden . Der MacQueens k-means-Algorithmus sollte nur Speicher benötigen .k ≤ ( d + 1 )
Da die meisten Benutzer jedoch wissen möchten, welcher Punkt zu welchem Cluster gehört, verwendet fast jede Implementierung, die Sie finden, -Speicher.
Mit anderen Worten ist der durch k-Mittel verwendete Speicher im Wesentlichen die Ausgangsdatengröße .
Ich bin kürzlich auf eine scipy-Implementierung des k-means-Algorithmus in scipy.cluster.vq.py gestoßen
Notes ----- This could be faster when number of codebooks is small, but it becomes a real memory hog when codebook is large. It requires N by M by O storage where N=number of obs, M = number of features, and O = number of codes.