Wann ist Deep Learning Overkill?

14

Wenn Sie beispielsweise E-Mails als Spam klassifizieren, lohnt es sich aus Zeit- / Genauigkeitssicht, Deep Learning (wenn möglich) anstelle eines anderen Algorithmus für maschinelles Lernen anzuwenden ? Wird Deep Learning andere maschinelle Lernalgorithmen wie naive Bayes überflüssig machen?

— Alexander
quelle

13

Es geht nur um Return on Investment . Wenn DL "wert ist", ist es kein Overkill.

Wenn die Kosten für die Verwendung von DL (Computerzyklen, Speicherung, Schulungszeit) akzeptabel sind und die für das Training verfügbaren Daten reichlich vorhanden sind und der marginale Vorteil gegenüber alternativen Algorithmen wertvoll ist, ist DL ein Gewinn.

Aber, wie Sie vorschlagen, wenn Ihr Problem alternativen Methoden zugänglich ist, insbesondere wenn es ein Signal bietet, das gut mit klassischen Methoden wie Regression oder naivem Bayes übereinstimmt, oder wenn Ihr Problem eine Erklärung benötigt, warum die Entscheidungsgrenze dort ist, wo sie ist (z. B. Entscheidungsbäume), oder wenn Ihren Daten die von DL (insbesondere CNNs) benötigten kontinuierlichen Gradienten fehlen oder sich Ihre Daten im Laufe der Zeit ändern, was eine regelmäßige Umschulung erforderlich machen würde (insbesondere in unvorhersehbaren Intervallen), ist DL wahrscheinlich eine Fehlanpassung für Sie.

— Geil
quelle

11

Deep Learning ist mächtig, aber nicht überlegene Methode als Bayesian. Sie arbeiten gut in dem, wofür sie entwickelt wurden:

Nutze tiefes Lernen:

Die Kosten für die Berechnung sind viel günstiger als die Kosten für die Stichprobe (z. B. Verarbeitung natürlicher Sprache).
Wenn Sie ein stark nichtlineares Problem haben
Wenn Sie das Feature-Engineering vereinfachen möchten
Wenn Sie keine vorherige Verteilung haben (zB: Setzen Sie die Gewichte auf zufälliges Gauß). Oder Sie tun, aber Sie stören sich nicht an der Komplexität.
Wenn Sie Genauigkeit für Geschwindigkeit wollen (tiefes Lernen ist langsam)

Verwenden Sie naive Bayesian:

Wenn Sie eine vorherige Verteilung haben, die Sie verwenden möchten
Wenn Sie Ihr Modell schnell und einfach aktualisieren möchten (insbesondere Conjour-Modelle)
Wenn Sie eine eigene Wahrscheinlichkeitsfunktion haben und steuern möchten, wie genau das Modell funktioniert
Wenn Sie hierarchische Modelle modellieren möchten
Wenn Sie die Parameter nicht optimieren möchten
Wenn Sie ein schnelleres Modell wollen, sowohl in der Ausbildung als auch in der Ausführung
Wenn Sie die Unabhängigkeitsannahme machen wollen
Wenn Sie Überanpassung verhindern möchten (das ist ein sehr einfaches Modell)

— Hallo Welt
quelle