Angesichts des laufenden TCEC-Turniers dachte ich, wie kommen sie zu den Bewertungen dieser Computer? Vermutlich sollte eine Schach-Engine mit einer Bewertung von 2000 eine Punktzahl von etwa 0,5 gegenüber einer 2000-bewerteten Schach-Engine erwarten. Dies macht es möglicherweise einfach zu überprüfen, ob Schach-Engines wirklich ungefähr der Bewertung entsprechen, die sie angeblich abgeben. Dies ist jedoch problematisch für höher bewertete Programme wie komodo, der angeblich bei 3250 liegt. Offensichtlich spielen keine Menschen auf diesem Niveau. Darüber hinaus spielen selbst 2800 bewertete Computer nicht gegen Menschen (ich bezweifle, dass Magnus gegen Computer spielt, um Entwicklern bei der Definition ihrer Bewertung zu helfen). Es ist sogar verdächtig, wenn Motoren gegen Großmeister spielen, um ihre Stärke zu bestimmen. Ich vermute also, dass diese Motorbewertungen von Motoren bestimmt werden, die vor langer Zeit Gegner ähnlicher Stärke spielen. und die meisten Bewertungen stammen heutzutage von Engine vs Engine-Spielen. Aber wenn dies wahr wäre, würde ich nicht erwarten, dass die Motorbewertungen im Vergleich zur menschlichen Elo-Skala genau sind. Gibt es eine Möglichkeit, die Richtigkeit der Motorwerte zu überprüfen?