Geschwindigkeit
Neuronale Netze arbeiten viel langsamer als handgefertigte Auswertungsfunktionen. Im TCEC Superfinal kann Leela Chess Zero auf zwei GPUs mit jeweils dedizierten Tensorkernen rund 60.000 Positionen pro Sekunde suchen. Im Gegensatz dazu durchsucht Stockfish auf einem einzelnen Kern meines PCs über 2 Millionen Positionen pro Sekunde.
Während moderne Motoren über eine große Auswahl an Techniken verfügen , um unnötige Äste abzuschneiden , ist die Alpha-Beta-Baumsuche immer noch eine Brute-Force-Technik, bei der eine große Anzahl von Positionen durchsucht werden muss, um gute Züge zu bestimmen.
Im Gegensatz dazu ist MCTS weitaus selektiver und erweitert seinen Suchbaum nur in Richtung der vielversprechendsten Schritte, sodass er die begrenzte Anzahl von Knoten, die durchsucht werden können, optimal nutzen kann.
Schlimmstes Verhalten
Eine der Hauptanforderungen der Bewertungsfunktion für eine Engine, die auf der Alpha-Beta-Suche basiert, ist ein gutes Worst-Case-Verhalten . Dies liegt daran, dass jeder große Fehler in der Auswertung, wie selten er auch sein mag, leicht auf die Wurzel übertragen werden kann und zu einem entsetzlich falschen Zug führt.
Neuronale Netze sind aufgrund ihrer Komplexität anfällig für Überanpassungen und können nur so gut sein wie die Daten, mit denen sie trainiert wurden. In Match 80 des Superfinales der TCEC-Saison 14 war Lc0 im 47. Zug anscheinend unbeeindruckt von Stockfishs zusätzlicher Königin und bewertete die Position als coole +0,77, während Stockfish (und die meisten anderen Motoren) eine Bewertung von +8,31 aufwies. Eine beliebte Erklärung dafür ist, dass Lc0 möglicherweise nicht viele Spiele mit mehreren Damen auf dem Brett in seinem Trainingsset hatte.
Neuronale Netze weisen daher ein schlechtes Worst-Case-Verhalten auf und können daher bei der Alpha-Beta-Suche schlecht abschneiden. Im Gegensatz dazu ermöglicht MCTS, dass eine einer Position zugewiesene falsche Punktzahl ausgeglichen wird, indem sie mit angemessenen Punktzahlen herausgemittelt wird, die Positionen in der Nähe der Suche zugewiesen werden.
Ruhe
Alle starken Alpha-Beta-Engines verwenden eine Technik namens Ruhesuche , eine eingeschränkte Form der Alpha-Beta-Suche, die an Blattknoten angewendet wird, um zu erkennen, dass ihre handgefertigten Bewertungsfunktionen nur in "ruhigen" Positionen gut funktionieren, in denen keine Erfassungen oder Überprüfungen anstehen .
Unmittelbar nach der ersten Hälfte eines Königintauschs kann eine handgefertigte Bewertungsfunktion Ihnen beispielsweise mitteilen, dass die Seite, deren Königin gerade genommen wurde, vollständig verloren ist, wohingegen ein neuronales Netzwerk möglicherweise verstehen kann, dass die Königin bald wiedererobert wird.
Dies macht handgefertigte Auswertungsfunktionen aufgrund des Fehlens einer Ruhesuche für MCTS ebenfalls ungeeignet, was dazu führt, dass die handgefertigten Funktionen die meiste Zeit eine schlechte Leistung erbringen (obwohl Komodo 12 MCTS diese Einschränkung umgeht, indem es ohnehin kurze Alpha-Beta-Suchen verwendet , um Ruhepositionen zu erhalten und Erlauben Sie daher der handgefertigten Bewertung, eine angemessene Punktzahl zu erhalten.