Die Antwort auf diese Frage interessierte mich (und interessiert mich immer noch) sehr, da dies eine interessante Variante der Komplexität von Spielen ist, die noch nicht gelöst wurde. Deshalb bot ich ein Kopfgeld an. Ich dachte, die ursprüngliche Frage sei sehr wahrscheinlich zu schwer, also habe ich drei verwandte Fragen gestellt, die ebenfalls der Prämie würdig wären. Niemand hat Antworten gepostet, bevor das Kopfgeld abgelaufen ist. Später konnte ich zwei der verwandten Fragen beantworten (Fragen 3 und 4, die unter meinem ursprünglichen Beitrag besprochen wurden). Dies zeigte, dass die Annäherung des Werts von Schiedsrichter-Spielen mit korrelierten halbprivaten Münzen (unten definiert) EXPTIME-vollständig war. Die ursprüngliche Frage ist noch unbeantwortet. Ich wäre auch an Ergebnissen interessiert, die ähnliche Spiele zwischen PSPACE und EXPTIME in interessante Komplexitätsklassen bringen.
ORIGINAL POST:
Diese Frage wurde von der Diskussion über Itais Hex-Frage inspiriert . Ein Schiedsrichterspiel ist ein Spiel, bei dem zwei rechnerisch unbegrenzte Spieler miteinander kommunizieren, indem sie einen Polynom-Zeit-Prüfer verwenden, der private Münzen werfen kann (daher ist die Anzahl der Runden und der Umfang der Kommunikation auch polynom-Zeit-begrenzt). Am Ende des Spiels führt der Schiedsrichter einen Algorithmus in P aus, um zu bestimmen, wer gewinnt. Die Entscheidung, wer ein solches Spiel gewinnt (auch ungefähr), ist EXPTIME abgeschlossen. Wenn Sie öffentliche Münzen und öffentliche Kommunikation haben, sind solche Spiele in PSPACE. ( Siehe Feige und Killian, "Making Games Short". ) Meine Frage betrifft die Grenze zwischen diesen beiden Ergebnissen.
Frage: Angenommen, Sie haben zwei rechnerisch unbegrenzte Spieler, die ein Spiel in Polynomlänge spielen. Die Rolle des Schiedsrichters ist darauf beschränkt, jedem Spieler vor jedem Zug einige private Münzwürfe zu ermöglichen (die nicht mit denen des anderen Spielers korrelieren). Alle Züge des Spielers sind öffentlich und werden von seinem Gegner gesehen - die einzige private Information sind die Münzwürfe. Am Ende des Spiels werden alle privaten Münzwürfe aufgedeckt, und der Mehrfachschiedsrichter verwendet diese Münzwürfe und die Züge des Spielers, um zu entscheiden, wer gewinnt.
Nach dem Ergebnis der Schiedsrichter-Spiele liegt die ungefähre Wahrscheinlichkeit, dass der erste Spieler gewinnt, bei EXPTIME, und es ist auch eindeutig PSPACE-schwer. Welches ist es? Ist etwas über dieses Problem bekannt?
Beachten Sie, dass die Spieler möglicherweise gemischte Strategien anwenden müssen, da Sie auf diese Weise Nullsummen-Matrixspiele (a la von Neumann) spielen können.
ZUSATZMATERIAL:
Nennen wir diese Komplexität Klasse RGUSP (alle Sprachen , die zu einem referierten Spiel mit Unkorrelierte Semi Münzen reduziert werden kann , wie oben beschrieben, so dass , wenn x ∈ L , Spieler 1 gewinnt mit Wahrscheinlichkeit ≥ 2 / 3 , und wenn x ∉ L , Spieler 1 gewinnt mit einer Wahrscheinlichkeit von ≤ 1 / 3 ). Meine drei verwandten Fragen sind:
Frage 2: RGUSP scheint ziemlich robust zu sein. Wenn wir beispielsweise das Spiel so ändern, dass der Schiedsrichter keine Nachrichten sendet, sondern nur die öffentlichen Nachrichten von Spieler 1 und 2 beachtet und private Nachrichten von ihnen empfängt, entspricht die Annäherung des Werts dieses Spiels immer noch RGUSP. Ich möchte demonstrieren, dass RGUSP robust ist, also bin ich bereit, jedem, der eine natürliche Komplexitätsklasse C vorfindet, das Kopfgeld zu geben, so dass PSPACE C ⊆ RGUSP, wo keiner der Containments genau zu sein scheint.
Frage 3: Ich habe auch den starken Verdacht, dass die Klasse RGCSP (Referierte Spiele mit korrelierten halbpriven Münzen) EXPTIME vollständig ist, und ich bin auch bereit, jemandem, der diese Tatsache beweist, das Kopfgeld zu geben. In RGCSP gibt der Schiedsrichter im ersten Schritt den beiden Spielern korrelierte Zufallsvariablen (zum Beispiel kann er dem ersten Spieler einen Punkt in einer großen Projektionsebene geben und dem zweiten Spieler eine Linie, die diesen Punkt enthält). Danach senden die beiden Spieler für eine polynomielle Anzahl von Runden abwechselnd öffentliche Nachrichten in Polygröße. Nach dem Spiel entscheidet der Mehrfachschiedsrichter, wer gewonnen hat. Wie komplex ist es, die Gewinnwahrscheinlichkeit für Spieler 1 zu approximieren?
Frage 4: Schließlich habe ich noch eine Frage, die sich wirklich mit Kryptographie und Wahrscheinlichkeitsverteilungen befassen könnte: Wenn zwei Spieler in einem Schiedsrichterspiel mit nicht korrelierten halbprivaten Münzen eine vergessene Übertragung ausführen können, können sie ein beliebiges Schiedsrichterspiel mit korrelierten Münzen spielen (oder lässt es sie alternativ ein Spiel spielen, um zu bestimmen, welcher Gewinner EXPTIME-complete ist)?