Ich bin neu im maschinellen Lernen und versuche, mit Scikit-Learn (sklearn) ein Klassifizierungsproblem zu lösen. Sowohl DecisionTree als auch SVM können einen Klassifikator für dieses Problem trainieren.
Ich verwende sklearn.ensemble.RandomForestClassifier
und sklearn.svm.SVC
passe die gleichen Trainingsdaten an (ca. 500.000 Einträge mit 50 Funktionen pro Eintrag). Der RandomForestClassifier bringt in etwa einer Minute einen Klassifikator heraus. Der SVC benötigt mehr als 24 Stunden und läuft weiter.
Warum arbeitet der SVC so ineffizient? Ist der Datensatz für SVC zu groß ? Ist SVC für ein solches Problem ungeeignet ?