Ich frage mich, wie man ein neuronales Netzwerk für ein rundenbasiertes Brettspiel wie Tic-Tac-Toe, Schach, Risiko oder ein anderes rundenbasiertes Spiel trainiert. Das Erhalten des nächsten Zuges durch Inferenz scheint ziemlich einfach zu sein, indem der Spielstatus als Eingabe eingegeben und die Ausgabe als Zug für den aktuellen Spieler verwendet wird. Das Training einer KI für diesen Zweck scheint jedoch nicht so einfach zu sein, weil:
- Es gibt möglicherweise keine Bewertung, ob ein einzelner Zug gut ist oder nicht, daher scheint das Training einzelner Züge nicht die richtige Wahl zu sein
- Die Verwendung aller Spielzustände (Eingaben) und Bewegungen (Ausgaben) des gesamten Spiels zum Trainieren des neuronalen Netzwerks scheint nicht die richtige Wahl zu sein, da möglicherweise nicht alle Bewegungen innerhalb eines verlorenen Spiels schlecht sind
Ich frage mich also, wie ich ein neuronales Netzwerk für ein rundenbasiertes Brettspiel trainieren kann. Ich möchte mit Tensorflow ein neuronales Netzwerk für Tic-Tac-Toe erstellen.