Ich habe keine zufriedenstellende Antwort von Google gefunden .
Wenn die Daten, die ich habe, in der Größenordnung von Millionen liegen, ist Deep Learning natürlich der richtige Weg.
Und ich habe gelesen, dass es vielleicht besser ist, beim maschinellen Lernen andere Methoden zu verwenden, wenn ich keine großen Datenmengen habe. Der angegebene Grund ist zu passend. Maschinelles Lernen: dh Betrachten von Daten, Extrahieren von Merkmalen, Erstellen neuer Merkmale aus dem Gesammelten usw. Dinge wie Entfernen stark korrelierter Variablen usw. Das gesamte maschinelle Lernen 9 Meter.
Und ich habe mich gefragt: Warum sind neuronale Netze mit einer verborgenen Schicht kein Allheilmittel gegen Probleme des maschinellen Lernens? Sie sind universelle Schätzer, Überanpassungen können mit Dropout, l2-Regularisierung, l1-Regularisierung und Batch-Normalisierung verwaltet werden. Die Trainingsgeschwindigkeit ist im Allgemeinen kein Problem, wenn wir nur 50.000 Trainingsbeispiele haben. Sie sind zum Testzeitpunkt besser als zum Beispiel zufällige Wälder.
Warum also nicht - bereinigen Sie die Daten, setzen Sie fehlende Werte auf die übliche Weise um, zentrieren Sie die Daten, standardisieren Sie die Daten, werfen Sie sie in ein Ensemble neuronaler Netzwerke mit einer verborgenen Ebene und wenden Sie die Regularisierung an, bis Sie keine Überanpassung mehr bemerken, und trainieren Sie dann sie bis zum Ende. Keine Probleme mit der Gradientenexplosion oder dem Verschwinden des Gradienten, da es sich nur um ein zweischichtiges Netzwerk handelt. Wenn tiefe Schichten benötigt würden, müssten hierarchische Merkmale erlernt werden, und andere Algorithmen für maschinelles Lernen wären ebenfalls nicht gut. Zum Beispiel ist SVM ein neuronales Netzwerk mit nur Gelenkverlust.
Ein Beispiel, bei dem ein anderer Algorithmus für maschinelles Lernen ein sorgfältig reguliertes 2-Schichten- (vielleicht 3?) Neuronales Netzwerk übertreffen würde, wäre wünschenswert. Sie können mir den Link zum Problem geben und ich würde das beste neuronale Netzwerk trainieren, das ich kann, und wir können sehen, ob zwei- oder dreischichtige neuronale Netzwerke keinem anderen Benchmark-Algorithmus für maschinelles Lernen entsprechen.