Antworten:
Laut dem Artikel Ein Vergleich von CNN-basierten Gesichts- und Kopfdetektoren für Echtzeit-Videoüberwachungsanwendungen CNN-basierte neuronale Netze sind hinsichtlich der Präzision deutlich besser als Viola-Jones, benötigen jedoch mehr Rechenleistung, um die Ergebnisse zu berechnen. Der mittlere durchschnittliche Genauigkeitsfehler für CNN-basierte Netzwerke ist fünfmal geringer als für VJ für FDDB-Daten. Hier ist die Präzisionsvergleichstabelle aus dem Papier:
VJ ermöglicht jedoch eine Echtzeiterkennung mit 60 Bildern pro Sekunde. Hier ist der Geschwindigkeitsvergleich aus demselben Artikel: