Warum waren Schachexperten vom Sieg des AlphaZero gegen Stockfish überrascht?


10

Vor kurzem wurde ich darauf aufmerksam gemacht, dass Schachexperten das Ergebnis dieses mittlerweile berühmten Spiels als etwas verärgert empfanden.

Siehe: Der neue beste Spieler des Schachs ist ein furchtloser, verwegener Algorithmus

Als Nicht-Experte für Schach und Schach-KI ging ich davon aus, dass die ältere KI aufgrund der Leistung von AlphaGo und der Validierung dieser Art von Methode in Bezug auf kombinatorische Spiele keine Chance haben würde.

  • Warum war der Sieg von AlphaZero überraschend?

Antworten:


14

Gute Frage.

In erster Linie hatte Deepmind in Go keine übermenschlichen Gegner, die er herausfordern konnte. Go-Motoren waren nicht annähernd das höchste Niveau der besten menschlichen Spieler. Im Schach sind die Motoren jedoch 500 ELO-Punkte stärker als die besten menschlichen Spieler. Das ist ein massiver Unterschied. Die Menge an Arbeit, die in zeitgenössische Schach-Engines gesteckt wurde, ist atemberaubend. Wir sprechen über Millionen von Stunden in der Programmierung, Hunderttausende von Iterationen. Es ist eine riesige Menge an Wissen und Arbeit. All das in 4 Stunden zu überwinden und zu übertreffen, ist atemberaubend.

Zweitens ist es nicht so sehr das Ergebnis selbst, das die Schachmeister überrascht, sondern vielmehr, wie AlphaZero Schach spielt. Es ist ziemlich ironisch, dass ein System, das kein menschliches Wissen oder Know-how hatte, am besten spielt wie wir. Motoren sind dafür berüchtigt, hässlich aussehende Moves zu spielen, solche, denen es an Harmonie mangelt usw. Es ist schwer, sie einem Nicht-Schachspieler zu erklären, aber es gibt so etwas wie einen "künstlichen Move", wie ihn die modernen Engines oft finden. AlphaZero spielt überhaupt nicht so. Es hat einen sehr menschenähnlichen Stil, in dem es die gegnerischen Figuren mit tiefem strategischem Spiel und atemberaubenden Positionsopfern dominiert. AlphaZero spielt so, wie wir es uns wünschen, und kombiniert tiefes Positionsverständnis mit der Präzision einer Motorenberechnung.

Bearbeiten Oh und ich habe vergessen, etwas über das Ergebnis selbst zu erwähnen. Wenn Sie mit Computerschach nicht vertraut sind, mag es nicht erstaunlich erscheinen, aber es ist.

Heutzutage sind die Gewinnspannen, die die modernen Top-Motoren trennen, hauchdünn. In einem Match mit 100 Spielen können Sie ein Ergebnis wie 85 Unentschieden, 9 Siege und 6 Niederlagen erwarten, um die bessere Engine zu ermitteln.

AlphaZero 28 Siege und 72 Unentschieden ohne Verluste waren jenseitig vernichtend und bis zu dem Moment, als es passierte, völlig undenkbar.


Gute Antwort. Ihr Punkt zum Vergleich zwischen AI's re Chess ist interessant im Hinblick auf die Einschränkung, die auf Chess 'Loopiness und der Win / Loss / Draw-Triade basiert. (Möglicherweise werden wir in Zukunft endliche, unlösbare Spiele brauchen, die eine detailliertere Analyse der Ergebnisse ermöglichen.) Ich bin mit der Geschichte der Schach-Engines und dem enormen Aufwand und dem menschlichen Wissen vertraut, das in sie geflossen ist, aber Der Kontext des mangelnden Erfolgs bezüglich: Der viel komplexere 19x19 Go hatte für mich eine entgegengesetzte Konsequenz.
DukeZhou

Insbesondere ging ich davon aus, dass wenn AlphaGo die Top-Menschen in dem wesentlich komplexeren Spiel schlagen könnte, es vernünftig erscheint, dass es nicht nur die Top-Menschen, sondern auch die Top-Vorgänger-KI in jedem anderen Spiel schlagen würde.
DukeZhou

Das bisschen über künstliche Züge ist ziemlich wichtig und nicht etwas, worüber ich Nicht-Schachspieler gesprochen habe. +1
Stella Biderman

4

MCTS für Schach war in der Literatur mit wenig Erfolg ausprobiert worden. Es wurde angenommen, dass AlphaGos Ansatz niemals beim Schach funktionieren würde , vielleicht in Go, aber nicht im Schach. Plötzlich gab Google bekannt, dass der Ansatz funktioniert und das stärkste Schachprogramm der Welt deutlich übertrifft.

Vor Google wurde allen Schachprogrammierern beigebracht, dass das Erstellen von Heuristiken in der Motorprogrammierung eine bessere Strategie als maschinelles Lernen ist. Unabhängig davon, wie Sie neuronale Netze implementiert haben, wäre es niemals schneller gelaufen als eine Reihe von 64-Bit-Bitboard-Anweisungen. AlphaGo lief ziemlich langsam , spielte aber das stärkste Schach.


2

Ich sehe, basierend auf den Artikeln, die Sie zur Verfügung stellen, viele Überraschungsstufen beim Sieg:

Schach ist schwer zu meistern und das Gegenstück hatte die besten Praktiken der Welt, AlphaZero hatte tabula rasa.

Das Lernen dauerte vier Stunden und AlphaZero verlor kein Match von 100.

Der Spielstil war eine fremde Mischung aus menschlichen und computerähnlichen Bewegungen, aggressiv und manchmal albern mit Opfern, die keine Ahnung haben, aber den zukünftigen Status tatsächlich stärken.

Die Anzahl der pro Zug berücksichtigten Möglichkeiten war geringer als das Gegenstück. AlphaZero hatte ein mysteriöses Bauchgefühl oder eine mysteriöse Intuition.

Das verärgerte Gefühl kam von der Menge an Trainingsmaterial, mit der AlphaZero sich selbst gebaut hatte, und dem Zeitlimit, das der traditionellen Maschine möglicherweise nicht genügend Zeit ließ.


Aaah. Dies war auf mangelndes Vertrauen in die neue KI-Methode zurückzuführen. Das macht Sinn.
DukeZhou
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.