BEARBEITEN
Der Link von @ unutbu im Kommentar ist eine gute Einführung.
Solides Verständnis für AlphaZero erfordert höchstwahrscheinlich einen quantitativen Abschluss (PhD?). Fragen Sie nach einem Crashkurs in AlphaZero?
Bitte beachten Sie , dass nichts, was ich sage, funktioniert , wenn Sie nicht einen erheblichen Teil Ihrer Zeit investieren . Es gibt kein Buch, das möglicherweise alles abdecken kann. Sie müssen sehr hart arbeiten.
Probieren wir es aus. Crashkurs für AlphaZero.
1. Grundlegendes Verständnis beim maschinellen Lernen
Unzählige Bücher. Aber wenn Sie keine Zeit haben, würde ich Professor Andrew Ngs Kurse zum maschinellen Lernen auf Coursera empfehlen.
Ihre Schlüsselwörter: Trainingssätze, Testsätze, stochastischer Gradientenabstieg, Lernrate, GPU, Kostenfunktion, Kreuzentropie .
2. Tief neutrale Netzwerke
Sie müssen sich mit neuronalen Netzen auskennen. Ich würde Professor Ian Goodfellow das Deep-Learning-Buch empfehlen, wenn Sie es ernst meinen. Wenn Sie keine Zeit haben, folgen Sie bitte erneut dem Online-Kurs von Professor Andrew Ng über Coursera. Sie müssen nicht alle Kapitel durchgehen (aber Sie sollten!).
YouTube bietet viele schnelle Einführungen in neuronale Netze. Probieren Sie sie aus.
Ihre Schlüsselwörter: Neuron, Schichten, Gewichte, Voreingenommenheit, Mini-Batch, Aktivierung .
3. Monte-Carlo-Baumsuche
Sie sollten verstehen, was Monte Carlo ist. Bücher über Monte Carlo gibt es überall bei Amazon. Lesen Sie die Wikipedia über MCTS, wenn Sie keine Zeit haben.
Ihre Schlüsselwörter: Sampling, Erweiterung, Simulation, Rollouts, Backpropagation .
3. Verstärkungslernen
Ihre Schlüsselwörter: Richtliniengradient, Gradientenabstieg, Lernrate
5. Schachbrettdarstellung
Das Papier selbst ist am einfachsten. Das Modell codiert den Board-Status (z. B. Teile) als eine Reihe von One-Hot-Codierungs-Binärwerten.
6. MCTS gegen Alpha-Beta