Wenn ich maschinelles Lernen entdecke, sehe ich verschiedene interessante Techniken wie:
- automatisch tune Algorithmen mit Techniken wie
grid search
, - Erhalten Sie genauere Ergebnisse durch die Kombination verschiedener Algorithmen desselben "Typs"
boosting
. - Erhalten Sie genauere Ergebnisse durch die Kombination verschiedener Algorithmen (aber nicht derselben Art von Algorithmen)
stacking
. - und wahrscheinlich noch viel mehr muss ich entdecken ...
Meine Frage lautet wie folgt: Es gibt all diese Teile. Aber ist es möglich, sie zu einem Algorithmus zusammenzufassen, der als Eingabe gereinigte Daten verwendet und gute Ergebnisse liefert, indem das Beste aus allen Techniken herausgeholt wird? (Natürlich ist es wahrscheinlich weniger effizient als ein professioneller Datenwissenschaftler, aber er ist besser als ich!) Wenn ja, haben Sie Beispielcodes oder kennen Frameworks, die das können?
BEARBEITEN: Nach einigen Antworten scheint es, dass eine Verengung vorgenommen werden muss. Nehmen wir ein Beispiel, wir haben eine Spalte mit kategorialen Daten, nennen y
wir sie und möchten sie anhand numerischer Daten vorhersagen X
, die entweder Dummies oder reale numerische Daten (Höhe, Temperatur) sind. Wir gehen davon aus, dass die Reinigung zuvor durchgeführt wurde. Gibt es einen Algorithmus, der solche Daten aufnehmen und eine Vorhersage ausgeben kann? (durch Testen mehrerer Algorithmen, Optimieren, Boosten usw.) Wenn ja, ist es recheneffizient (werden die Berechnungen in einer angemessenen Zeit ausgeführt, wenn wir sie mit normalen Algorithmen vergleichen), und haben Sie ein Codebeispiel?
auto.arima
(aus der forecast
Bibliothek) können besser sein als Menschen - das hat Rob Hyndman mehrfach in seinen Präsentationen erwähnt. Es gibt also Bereiche, in denen einige Arten von "automatischem Lernen" mit Erfolg angewendet werden.