Warum verwendet das Elo-Bewertungssystem eine falsche Aktualisierungsregel?


10

Das Elo-Bewertungssystem verwendet einen Gradientenabstiegsminimierungsalgorithmus der Kreuzentropieverlustfunktion zwischen der erwarteten und der beobachteten Wahrscheinlichkeit eines Ergebnisses in gepaarten Vergleichen. Wir können die allgemeinen Verlustfunktionen als schreiben

E=n,ipiLog(qi)

wobei die Summe über alle Ergebnisse und alle Gegner . ist die beobachtete Frequenz des Ereignisses und die erwartete Frequenz.inpiiqi

Bei nur zwei möglichen Ergebnissen (gewinnen oder verlieren) und einem Gegner haben wir

E=pLog(q)(1p)Log(1q)

Wenn die Rangfolge des Spielers und die Rangfolge des Spielers , können wir die erwartete Wahrscheinlichkeit als Dann wird die Aktualisierungsregel für den Gradientenabstieg verwendetπiiπjj

qi=eπieπi+eπj
qj=eπjeπi+eπj

πi=πiη(qipi)

πj=πjη(qjpj)

Dabei sind und die erwartete und beobachtete Gewinnwahrscheinlichkeit des Spielers gegen den Spieler . Dies sind die Aktualisierungsregeln.qipiijtwo outcomes

Bei Vorhandensein von Ziehungen können wir das obige Modell einschließlich und des dritten Ergebnisses mit Wahrscheinlichkeit verallgemeinern

q(d)=νeπi+πj2eπi+eπj+νeπi+πj2
qi(w)=eπieπi+eπj+νeπi+πj2
qj(w)=eπjeπi+eπj+νeπi+πj2

Und wir können die Verlustfunktion als erstellen

E=p(w)Log(q(w))(1p(w)p(d))Log(q(l))p(d)Log(q(d))

wobei ist jeweils die beobachteten Wahrscheinlichkeit , und und erwartete Wahrscheinlichkeit , und . Im letzteren Fall wäre die Aktualisierungsregelp(w),p(l),p(d)winloosedrawq(w),q(l),q(d)winloosedraw

πi=πiη(qi(w)+qi(d)2pi(w)pi(d)2)

πj=πjη(qj(w)+qj(d)2pj(w)pj(d)2)

wobei und die erwartete Wahrscheinlichkeit sind, dass der Spieler gewinnt und gegen den Spieler zieht . Und wobei und die beobachtete Wahrscheinlichkeit sind, dass der Spieler gewinnt und gegen den Spieler zieht . Dies ist die Aktualisierungsregel.qj(w)qj(d)ijpi(w)pi(d)ijthree outcome

Die Frage ist, warum das Elo-Bewertungssystem die two outcomesAktualisierungsregeln auch bei Unentschieden verwendet.

Antworten:


3

Die Wahrscheinlichkeit des Zeichnens im Gegensatz zu einem entscheidenden Ergebnis ist im Elo-System nicht angegeben . Stattdessen wird ein Unentschieden - sowohl bei der erwarteten Leistung als auch beim Spielergebnis - als halber Sieg und halber Verlust betrachtet.

Ein Beispiel von der Elo-Seite in Wikipedia : "Die erwartete Punktzahl eines Spielers ist seine Gewinnwahrscheinlichkeit plus die Hälfte seiner Unentschiedenwahrscheinlichkeit. Eine erwartete Punktzahl von 0,75 könnte also eine Gewinnchance von 75%, eine Verlustchance von 25% und eine Chance von 0% bedeuten Auf der anderen Seite könnte es eine 50% ige Gewinnchance, eine 0% ige Verlustchance und eine 50% ige Gewinnchance bedeuten. "

Die Wahrscheinlichkeit des Zeichnens ist, wie gesagt, nicht angegeben und führt zu einer einfachen two outcomeAktualisierungsregel, , in der , also nach einem einzelnen Spiel (Sieg) oder (Unentschieden, als halber Gewinn) oder (Verlust).RA=RA+K(SAEA)SA=1(nw+0.5nd)+0(0.5nd+nl)SA=1SA=0.5SA=0

Wie Elo modelliert das Glicko-System keine Draws, sondern führt ein Update als Durchschnitt aus Gewinn und Verlust (pro Spieler) durch. Stattdessen werden im TrueSkill- Rangsystem "Unentschieden modelliert, indem angenommen wird, dass der Leistungsunterschied in einem bestimmten Spiel gering ist. Daher hängt die Chance auf ein Unentschieden nur vom Unterschied der Spielstärke der beiden Spieler ab. Jedoch empirische Ergebnisse im Spiel von Schach zeigen, dass Unentschieden zwischen Profispielern wahrscheinlicher sind als Anfänger. Daher scheint die Chance auf ein Unentschieden auch von der Fähigkeitsstufe abzuhängen. "

Dieser Ansatz erfordert für jedes Spiel eine andere spezifische Modellierung (und TrueSkill wird auf einige Microsoft Xbox-Spiele angewendet), sodass er für Elo und Glicko (nur für Schach entwickelt) geeignet ist und nicht für Rankade , unser Mehrzweck-Ranking-System.


"Die erwartete Punktzahl eines Spielers ist seine Gewinnwahrscheinlichkeit plus die Hälfte seiner Unentschiedenwahrscheinlichkeit." ist genau das, was ich in der obigen Formel gefunden habe. Wie auch immer, in der Elo-Aktualisierungsformel ist die Hälfte der Wahrscheinlichkeit des Zeichnens nicht angegeben, wie Sie hervorheben. Es bleibt die Frage, warum wir uns im Elo-Ranking-System nicht für Unentschieden interessieren.
Emanuele

1
Sie können immer (- siehe erstes Beispiel von Wikipedia und keine Chance Zeichnung) erwartet Punktzahl als die Chance zu gewinnen und die Chance zu verlieren auszudrücken. In diesem Fall ist "die erwartete Punktzahl eines Spielers seine Gewinnwahrscheinlichkeit" (und alles andere, da die halbe Wahrscheinlichkeit des Ziehens Null ist). Nach einem einzelnen Spiel ist das Ergebnis ein Sieg oder eine Niederlage oder ein halber Sieg. Selbst wenn Sie ein Spiel haben, in dem Unentschieden erlaubt sind, können Sie die Elo-Punktzahl mit nur einer Kombination aus Sieg und Niederlage aktualisieren, als hätten Unentschieden keine Chance.
Tomaso Neri
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.