Wann ist Deep Learning Overkill?


14

Wenn Sie beispielsweise E-Mails als Spam klassifizieren, lohnt es sich aus Zeit- / Genauigkeitssicht, Deep Learning (wenn möglich) anstelle eines anderen Algorithmus für maschinelles Lernen anzuwenden ? Wird Deep Learning andere maschinelle Lernalgorithmen wie naive Bayes überflüssig machen?

Antworten:


13

Es geht nur um Return on Investment . Wenn DL "wert ist", ist es kein Overkill.

Wenn die Kosten für die Verwendung von DL (Computerzyklen, Speicherung, Schulungszeit) akzeptabel sind und die für das Training verfügbaren Daten reichlich vorhanden sind und der marginale Vorteil gegenüber alternativen Algorithmen wertvoll ist, ist DL ein Gewinn.

Aber, wie Sie vorschlagen, wenn Ihr Problem alternativen Methoden zugänglich ist, insbesondere wenn es ein Signal bietet, das gut mit klassischen Methoden wie Regression oder naivem Bayes übereinstimmt, oder wenn Ihr Problem eine Erklärung benötigt, warum die Entscheidungsgrenze dort ist, wo sie ist (z. B. Entscheidungsbäume), oder wenn Ihren Daten die von DL (insbesondere CNNs) benötigten kontinuierlichen Gradienten fehlen oder sich Ihre Daten im Laufe der Zeit ändern, was eine regelmäßige Umschulung erforderlich machen würde (insbesondere in unvorhersehbaren Intervallen), ist DL wahrscheinlich eine Fehlanpassung für Sie.


11

Deep Learning ist mächtig, aber nicht überlegene Methode als Bayesian. Sie arbeiten gut in dem, wofür sie entwickelt wurden:

Nutze tiefes Lernen:

  • Die Kosten für die Berechnung sind viel günstiger als die Kosten für die Stichprobe (z. B. Verarbeitung natürlicher Sprache).
  • Wenn Sie ein stark nichtlineares Problem haben
  • Wenn Sie das Feature-Engineering vereinfachen möchten
  • Wenn Sie keine vorherige Verteilung haben (zB: Setzen Sie die Gewichte auf zufälliges Gauß). Oder Sie tun, aber Sie stören sich nicht an der Komplexität.
  • Wenn Sie Genauigkeit für Geschwindigkeit wollen (tiefes Lernen ist langsam)

Verwenden Sie naive Bayesian:

  • Wenn Sie eine vorherige Verteilung haben, die Sie verwenden möchten
  • Wenn Sie Ihr Modell schnell und einfach aktualisieren möchten (insbesondere Conjour-Modelle)
  • Wenn Sie eine eigene Wahrscheinlichkeitsfunktion haben und steuern möchten, wie genau das Modell funktioniert
  • Wenn Sie hierarchische Modelle modellieren möchten
  • Wenn Sie die Parameter nicht optimieren möchten
  • Wenn Sie ein schnelleres Modell wollen, sowohl in der Ausbildung als auch in der Ausführung
  • Wenn Sie die Unabhängigkeitsannahme machen wollen
  • Wenn Sie Überanpassung verhindern möchten (das ist ein sehr einfaches Modell)
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.