Neben offensichtlichen Klassifizierereigenschaften wie
- Rechenaufwand,
- erwartete Datentypen von Features / Labels und
- Eignung für bestimmte Größen und Abmessungen von Datensätzen,
Was sind die fünf besten (oder 10, 20?) Klassifikatoren, um zuerst einen neuen Datensatz auszuprobieren, über den man noch nicht viel weiß (z. B. Semantik und Korrelation einzelner Merkmale)? Normalerweise probiere ich Naive Bayes, Nearest Neighbor, Decision Tree und SVM aus - obwohl ich keinen anderen Grund für diese Auswahl habe, als sie zu kennen und meistens zu verstehen, wie sie funktionieren.
Ich denke, man sollte Klassifikatoren wählen, die die wichtigsten allgemeinen Klassifikationsansätze abdecken . Welche Auswahl würden Sie nach diesem Kriterium oder aus einem anderen Grund empfehlen?
UPDATE: Eine alternative Formulierung für diese Frage könnte lauten: "Welche allgemeinen Ansätze zur Klassifizierung gibt es und welche spezifischen Methoden decken die wichtigsten / beliebtesten / vielversprechendsten ab?"