Ich versuche, Clustering-Methoden zu verstehen.
Was ich glaube, habe ich verstanden:
Beim überwachten Lernen sind die Kategorien / Labels, denen Daten zugewiesen werden, vor der Berechnung bekannt. Die Bezeichnungen, Klassen oder Kategorien werden also verwendet, um die Parameter zu "lernen", die für diese Cluster wirklich wichtig sind.
Beim unbeaufsichtigten Lernen werden Datensätze Segmenten zugeordnet, ohne dass die Cluster bekannt sind.
Bedeutet das, dass ich beaufsichtigtes Lernen vorziehen sollte, wenn ich nicht einmal weiß, welche Parameter für eine Segmentierung entscheidend sind?