Welche Klassifikatoren für maschinelles Lernen sind am parallelsten? Wenn Sie ein schwieriges Klassifizierungsproblem hätten, eine begrenzte Zeit, aber ein anständiges LAN an Computern, mit denen Sie arbeiten könnten, welche Klassifizierer würden Sie versuchen?
Auf den ersten Blick sieht es für mich wie einige Standardklassifikatoren aus, von denen ich weiß, dass sie sich wie folgt stapeln, aber ich könnte völlig falsch liegen:
Zufällige Wälder - Sehr parallelisierbar, solange jede Maschine alle Daten enthalten kann (dh die Trainingsdaten nicht per se aufteilen können, aber ansonsten parallelisierbar).
Erhöhen - ?
Support Vector Machine - Nicht sehr parallelisierbar.
Entscheidungsbäume - Kann teilweise aufgeteilt werden, aber nicht sehr effizient.