Wahrscheinlichkeit eines Spielverlusts als Funktion von Elo?


8

BlindKungFuMaster und ich führen eine Debatte ( http://chat.stackexchange.com/rooms/34484/discussion-between-blindkungfumaster-and-jeff-y ) und ich habe mich gefragt: Angesichts einer Position, die als "ungefähr" vereinbart werden kann gleich ", wie hoch ist die Wahrscheinlichkeit, dass ein bestimmter Spieler in Abhängigkeit von seiner Wertung bei einem einzelnen Zug einen Spielverlust macht? Ich frage unabhängig von der Stärke des Gegners , dh ob der Gegner den Fehler tatsächlich ausnutzt, um das Spiel zu gewinnen.

Es ist klar, dass Spiele verloren gehen, selbst von Großmeistern, selbst von den Besten. So (Schach - Annahme ist ein theoretischer Zug von der Startposition) , auch sie Spiel-Verlust bewegt mich gelegentlich machen. Die fragliche Wahrscheinlichkeit ist also selbst bei Elo 2800 eindeutig nicht Null. Wie hoch wäre diese Wahrscheinlichkeit beispielsweise bei ungefähr 2000, 1800, 1500, 1200 Bewertungen? Bei welcher Bewertung würde die Wahrscheinlichkeit ungefähr 50% betragen? Ist dies etwas, das auf irgendeine Weise definitiv berechnet werden kann, basierend auf der Definition von Elo und der durchschnittlichen Anzahl von Zügen pro Spiel? Oder wäre eine Antwort reine Vermutung?

Aktualisieren:

Ich habe alle Spiele aus der BIG99-Datenbank von ChessBase mit 1.114.429 Spielen extrahiert, wobei der Elo eines Spielers 2500 oder mehr und der Elo des anderen Spielers 2100 oder weniger beträgt. Es gibt 945 solcher Spiele. Nach dem Herausfiltern der Störungen (überraschenderweise gibt es 79 Gewinnstörungen und 102 Unentschieden) ist unten die Tabelle der Ply-Count gegen Elo aufgeführt. In der dunkleren Serie spielte der Verlierer schwarz, in der helleren Serie spielte der Verlierer weiß. Scheint eine Art Füllhorn zu sein.

Plot der Ply-Count gegen Elo für Verluste gegen 2500+


Ich denke jetzt, dass eine Analyse der Länge der Spiele, die Spieler gegen Gegner verloren haben, die mehr als 400 Punkte über ihnen liegen (mein Verständnis von Elos Punkt "100% Verlustchance"), ein Ausgangspunkt für diese Berechnung sein könnte ...
Jeff Y

1
Nicht alle gleichen Positionen sind gleich. Es gibt gefährliche gleiche Positionen, in denen ein Fehltritt leicht tödlich sein kann, und harmlose gleiche Positionen, in denen Sie eine große Auswahl an anständigen Bewegungen haben. Gegen starke Spieler sind die gleichen Positionen, die Sie erreichen, eher von der früheren Art. Und natürlich ist in Ihrer Analyse der "Spielverlust" am häufigsten in einer Position aufgetreten, die bereits ziemlich schlecht ist.
BlindKungFuMaster

Ich mag die Handlung, aber was ist ihre vertikale Achse?
23.

Die Darstellung lautet, wie in meinem obigen Text angegeben, "Ply-Count vs. Elo", daher ist die vertikale Achse "Spiellänge" in Einheiten der Ply-Count. ("Ply" ist ein Zug von einer Seite, manchmal auch als "halber Zug" bezeichnet.)
Jeff Y

Antworten:


11

Zufälligerweise habe ich genau diese Frage bereits als Antwort auf eine ähnliche Frage beantwortet .

Bearbeiten: Diese ähnliche Frage betraf die Häufigkeit von Fehlern in Spielen, was die Analyse etwas irreführend machte, wenn sie direkt auf diese Frage angewendet wurde. Ursprünglich suchte ich nach Fehlern von gleichen Positionen pro Spielzug , was die Ergebnisse etwas verwirrend machte, da es die unbekannte Variable gab, wie viele gleiche Positionen Sie tatsächlich pro Spielzug erhalten. Deshalb habe ich die Analyse auf Fehler pro gleicher Position überarbeitet, was in diesem Zusammenhang viel angemessener ist.

Ich habe zufällig einen Datensatz mit 25000 Spielen mit Stockfish-Bewertungen nach jedem Zug. Dies ermöglicht es, tatsächlich in gleichen Positionen nach Fehlern zu suchen, was ich auch getan habe.

Fehler von gleicher Position (-1,00 <eval <1,00) sind selbst bei schwächeren Spielern relativ selten. Das ist nicht besonders überraschend, da wir den Gleichstellungsbereich während der Eröffnung in kleinen Schritten verlassen und die Fehler auftreten, wenn wir unter echtem Druck stehen und wenig Zeit haben.

Ich habe die Analyse auch abhängig von der Stärke des Gegners durchgeführt, um zu zeigen, dass stärkere Gegner selbst in gleichen Positionen tatsächlich zu mehr Fehlern führen. Die stärkeren Gegner in der Analyse sind mehr als 100 Elo-Punkte höher bewertet, die schwächeren 100 Punkte niedriger bewertet. Spieler aller Stärken schlagen häufiger gegen stärkere Gegner aus gleichen Positionen als gegen schwächere Gegner.

Elo: 1500: 100cp Blunder every 26.4655172414 equal positions.
Elo: 1500: 100cp Blunder every 26.1266149871 equal positions against stronger players.
Elo: 1500: 100cp Blunder every 33.3684210526 equal positions against weaker players.

Elo: 1600: 100cp Blunder every 28.8888888889 equal positions.
Elo: 1600: 100cp Blunder every 28.3083832335 equal positions against stronger players.
Elo: 1600: 100cp Blunder every 37.12 equal positions against weaker players.

Elo: 1700: 100cp Blunder every 34.7788649706 equal positions.
Elo: 1700: 100cp Blunder every 34.0448933782 equal positions against stronger players.
Elo: 1700: 100cp Blunder every 39.7709923664 equal positions against weaker players.

Elo: 1800: 100cp Blunder every 34.9866156788 equal positions.
Elo: 1800: 100cp Blunder every 33.1406015038 equal positions against stronger players.
Elo: 1800: 100cp Blunder every 45.3865546218 equal positions against weaker players.

Elo: 1900: 100cp Blunder every 40.1570101725 equal positions.
Elo: 1900: 100cp Blunder every 38.315761729 equal positions against stronger players.
Elo: 1900: 100cp Blunder every 49.9418282548 equal positions against weaker players.

Elo: 2000: 100cp Blunder every 44.4308207705 equal positions.
Elo: 2000: 100cp Blunder every 41.5676238036 equal positions against stronger players.
Elo: 2000: 100cp Blunder every 56.3524305556 equal positions against weaker players.

Elo: 2100: 100cp Blunder every 52.5946657886 equal positions.
Elo: 2100: 100cp Blunder every 49.5823737821 equal positions against stronger players.
Elo: 2100: 100cp Blunder every 61.1668806162 equal positions against weaker players.

Elo: 2200: 100cp Blunder every 61.3163636364 equal positions.
Elo: 2200: 100cp Blunder every 56.0916284881 equal positions against stronger players.
Elo: 2200: 100cp Blunder every 75.2474916388 equal positions against weaker players.

Elo: 2300: 100cp Blunder every 69.6490486258 equal positions.
Elo: 2300: 100cp Blunder every 60.9148185484 equal positions against stronger players.
Elo: 2300: 100cp Blunder every 90.0941176471 equal positions against weaker players.

Elo: 2400: 100cp Blunder every 78.8800318852 equal positions.
Elo: 2400: 100cp Blunder every 67.7366828087 equal positions against stronger players.
Elo: 2400: 100cp Blunder every 100.431924883 equal positions against weaker players.

Elo: 2500: 100cp Blunder every 97.320568252 equal positions.
Elo: 2500: 100cp Blunder every 84.8542336549 equal positions against stronger players.
Elo: 2500: 100cp Blunder every 114.45814978 equal positions against weaker players.

Elo: 2600: 100cp Blunder every 110.2421875 equal positions.
Elo: 2600: 100cp Blunder every 97.9315068493 equal positions against stronger players.
Elo: 2600: 100cp Blunder every 127.470948012 equal positions against weaker players.

Elo: 2700: 100cp Blunder every 95.7817109145 equal positions.
Elo: 2700: 100cp Blunder every 78.6981818182 equal positions against stronger players.
Elo: 2700: 100cp Blunder every 167.296875 equal positions against weaker players.

Für eine Tabelle der geschätzten Fehlerwahrscheinlichkeit bei einem einzelnen Zug gilt Folgendes:

Elo 1500-1599:  0.0378
Elo 1600-1699:  0.0346
Elo 1700-1799:  0.0288
Elo 1800-1899:  0.0286
Elo 1900-1999:  0.0249
Elo 2000-2099:  0.0225
Elo 2100-2199:  0.0190
Elo 2200-2299:  0.0163
Elo 2300-2399:  0.0144
Elo 2400-2499:  0.0127
Elo 2500-2599:  0.0103
Elo 2600-2699:  0.0091
Elo 2700-2799:  0.0104

Eine Näherungsformel: p = (0.323 - 0.0850 * Elo / 1000) ^ 2

Diagramm der Wahrscheinlichkeit


Vielen Dank für die Daten und den Link zur Crafty-Analyse. Besonders interessant an dem Link ist, dass geradezu spielverlierende Züge häufiger sind als Züge, bei denen 4 oder mehr Bauern von eval verloren gehen. All dies konzentriert sich auf Single-Move-Fehler. Wenn Sie jedoch festgestellt haben, dass Spiele häufig inkrementeller verloren gehen (mehrere kleine Fehler häufen sich).
Jeff Y

Nun, das ist in Ihrer Frage angegeben: "Angesichts einer Position, die als" ungefähr gleich "vereinbart werden kann, wie hoch ist die Wahrscheinlichkeit, dass ein bestimmter Spieler bei einem einzelnen Zug einen Spielverlust macht". Inkrementelle Verluste sind eine andere Frage.
BlindKungFuMaster

1
Entschuldigung, wenn der Wortlaut der Frage nicht die theoretische Natur meiner Fragen wiedergibt, aber wie der zweite Absatz über "Jeder verliert Spiele" impliziert, frage ich im theoretischen Sinne nach "Spielverlust" . Irgendwann wechselt das Spiel notwendigerweise mit einem einzigen Zug von theoretisch gezogen zu theoretisch verloren. ZB ist ein 3-Bauern-Fehler (gemessen an einer Engine) möglicherweise nicht der (theoretische) Spielverlierer, sondern der 0,1-Bauern-Fehler im folgenden Zug, der ihn tatsächlich kippt.
Jeff Y

1
Die Idee, dass ein 1500 durchschnittlich 45 Bewegungen zwischen 1-Punkt-Fehlern gegen einen Magnus oder einen Computer mit 3300-Rating ausführen kann, klingt nicht richtig. Ich bin ungefähr 1500 ELO und ich weiß, dass ich Bewegungen in GM-Spielen nur 3 mal in 4 vorhersagen kann? Wenn ich 75% der Zeit den richtigen Zug wähle, habe ich eine 95% ige Chance, nach 10 oder 11 Zügen nicht den richtigen Zug zu wählen.
Tony Ennis

1
@BlindKungFuMaster Ich kann dieser Idee nicht zustimmen, dass irgendwie stärkere Gegner schwächere Züge oder mehr Fehler von einem Spieler hervorrufen. Wir müssen uns darauf einigen, dass wir uns nicht einig sind, bis weitere Daten
Jeff Y

1

Wenn es sich um einen reinen Spielverlust handelt, ist der Prozentsatz ziemlich hoch.

Denken Sie daran, dass man 20 suboptimale Züge machen könnte, die einzeln nicht tödlich wären. Aber zusammen ist es einfach zu viel.

Die einzige Möglichkeit, dies herauszufinden, besteht darin, die Spiele der Spieler mithilfe einer starken Engine bei Turnierkontrollen zu analysieren. Wenn der gespielte Zug einen bestimmten Schwellenwert überschreitet (z. B. 1 Punkt), wird der Zug als Verlierer gezählt.


1
Danke für die Antwort. Aber ich suchte eher nach einer kalkulierten Antwort oder nach einer Erklärung, warum sie nicht berechnet werden konnte. Von den 20 suboptimalen Zügen könnte nur einer der "Strohhalm" sein, der das Spiel von einem theoretischen Unentschieden zu einem theoretischen Verlust umdreht; Es spielt keine Rolle, nach welcher Wahrscheinlichkeit ich frage.
Jeff Y

@JeffY Beachten Sie auch, dass es in dieser Analyse keinen Unterschied zwischen einem 1200 ELO-Spieler und einem 2400 ELO-Spieler gibt. Beide verlieren gegen das beste Spiel. (Denken Sie an ein Traumteam der vorherigen 10 Weltmeister und ihrer Sekunden sowie an die Top 5 Computer auf der besten Hardware)
Tony Ennis

1
Richtig, aber die Frage ist: "Wie lange können sie sich festhalten?" Zu einer theoretisch gezeichneten Position, das heißt. Im Durchschnitt. Bevor sie ihren ersten Zug machen, der sich in eine theoretisch verlorene Position verwandelt. Vermutlich bleibt der 2400 länger hängen. Weil der 2400 eine geringere Wahrscheinlichkeit hat, "Spielverluste" zu machen.
Jeff Y

"Wie lange halten sie" ist eine andere Frage, da der Spielverlust normalerweise nicht mehr in der gleichen Position ist. Stattdessen neigen wir dazu, die Gleichheit in kleinen Schritten zu verlassen, je kleiner wir sind, desto stärker sind wir. Was bedeutet, dass der letzte Schritt zu einer verlorenen Position von "fast verloren" zu "verloren" für einen 2400, "ziemlich schlecht" zu "verloren" für 2100, "schlecht" zu "verloren" für 1800 und "unangenehm" zu "sein wird. verloren "für 1500. Aber" gleich "zu" verloren "ist für alle selten.
BlindKungFuMaster

1
Erinnerung: "theoretisch gezeichnet" unterscheidet sich stark von "gleiche Position". Dh dein "ziemlich schlecht" bedeutet immer noch theoretisch gezeichnet. "Festhalten an der theoretischen Auslosung" ist das, was ich mit "wie lange" meine.
Jeff Y

0

Wenn sie Ihren schlechten Zug nicht bestrafen, war es dann überhaupt wirklich schlecht?

Ich würde sagen, dass die normalen Statistiken gelten

Was ist die Chance, dass ein Spieler mit der Bewertung x einen Spieler mit der Bewertung y schlagen kann?

Wenn Sie kein Großmeister sind, ist der Gewinner derjenige, der den vorletzten Fehler gemacht hat

Bei einem bestimmten Schritt scheint die Chance, den fatalen Fehler zu machen, genau das zu sein, was die Bewertungen anzeigen würden, und sonst nichts

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.