Eine der am häufigsten gestellten Fragen auf dieser Website betrifft die Aussicht auf eine rein selbst ausgebildete Schach-KI.
Heute wird ChessBase von seiner Berichterstattung über das FIDE-Kandidatenturnier abgelenkt, um zu berichten, dass eine neue KI zum ersten Mal einen führenden Meister des etwas anderen Go-Spiels besiegt, der sich seit vielen Jahren gegen KIs im Schachstil wehrte. Eine erste Lektüre des Berichts legt nahe, dass die neue Go-KI keine Schach-KI ist, sondern eher eine allgemeine Spiel-KI (GGP). Der Artikel von ChessBase verwendet jedoch nicht den Begriff GGP, sondern scheint zu sagen, dass die Go-KI bei einfachen Videospielen gewinnen kann.
Gibt es einen Grund, warum eine solche gewinnbringende KI mit geringen Anpassungen nicht auch beim Schach gewinnen könnte? Wenn ja, verspricht eine solche KI das Erreichen des reinen Selbsttrainings, was zu diesem Zeitpunkt noch nicht möglich war? Warum oder warum nicht?
Ich vermute, dass noch keine wirklich vollständige, vollständig informierte Antwort auf meine Frage verfügbar ist. Daher wäre auch eine teilweise Antwort auf der Grundlage des entsprechenden Fachwissens wünschenswert.
Weitere Hinweise finden Sie auch in dieser verwandten Frage und den Antworten.
AKTUALISIEREN
Als die obige Frage vor fünf Tagen zum ersten Mal gestellt wurde und einige der guten Antworten unten gegeben wurden, waren gerade die ersten Nachrichten über den Sieg der Go-KI erschienen. Seitdem sind zusätzliche Informationen und Kommentare aufgetaucht.
Besonders interessant ist seitdem eine gut lesbare, fünfseitige Diskussionsrunde, in der Jonathan Schaeffer bemerkt:
Das Lernen aus menschlichen Spielen beschleunigt das Lernen des Programms. AlphaGo könnte lernen, selbst ein starker Spieler zu werden, ohne die menschlichen Spiele zu nutzen. Der Lernprozess würde nur länger dauern.
Nach Angaben des Gastgebers des Runden Tisches ist Schaeffer "Professor für Informatik an der Universität von Alberta und der Mann, der die Kontrolleure gelöst hat"; Vermutlich könnte er also befugt sein, Kommentare abzugeben.
Für weitere Informationen finden Sie hier die Aufzeichnung einer weiteren offenen Diskussion, von der viele Teilnehmer besser informiert zu sein scheinen als üblich. Die Diskussion fand während des Spiels statt.
Ein weiteres Update, eineinhalb Jahre später: commenter @MarkS. schreibt:
Dies ist nur ein Kommentar, denn es geht um Go, nicht um Schach, aber AlphaGo Zero hat "reines Selbsttraining" erreicht, nur weil bekannt wurde, wer gewonnen hat (und nicht das Endergebnis). Es ist stärker und weitaus effizienter als die KI, die Lee Sedol besiegt hat . Weitere Informationen finden Sie unter deepmind.com/blog/alphago-zero-learning-scratch