Gibt es Möglichkeiten, automatisch (keine menschlichen Tests) zu messen? A.


7

Daher weisen die meisten Ressourcen, die Sudoku-Rätsel bereitstellen, jedem Rätsel eine Schwierigkeitsstufe zu, selbst einige, die ich mit 15 oder mehr Schwierigkeitsstufen gesehen habe. Aber wie lassen sich diese Schwierigkeitsgrade gut zuordnen? Wenn genügend menschliche Rätsellöser verwendet würden, könnten die durchschnittliche Zeit, die ein Mensch benötigt, um ein Rätsel zu lösen, und der Prozentsatz der Personen, die das Rätsel erfolgreich gelöst haben, für die menschliche Stichprobe berechnet und die Schwierigkeitsstufen entsprechend zugewiesen werden. Es scheint jedoch, dass es vorhersehbare Szenarien geben sollte, die immer wieder auftreten, wenn verschiedene Rätsel gelöst werden, die sich auf die durchschnittliche menschliche Schwierigkeit auswirken. Diese könnten automatisch erkannt werden, wenn ein Computer das Rätsel löst, und diese Muster könnten dann zu einer vorhergesagten durchschnittlichen Schwierigkeit für den Menschen zusammengesetzt werden . Gibt es / was sind gute Techniken, um dies zu tun? Vielleicht maschinelles Lernen mit genügend Trainingsdaten zur menschlichen Leistung bei Beispielrätseln?


Für einen nicht statistischen Ansatz benötigen Sie eine Vorstellung davon, was diese "Härte" bzw. Mit welchen Parametern des Puzzles ist es verbunden (und wie)?
Raphael

Antworten:


8

Es gab viele solcher Versuche. Die meisten von ihnen versuchen, Abzugsregeln abzuleiten, mit denen Menschen Sudoku-Rätsel zu lösen scheinen.

Mein Geld ist für diesen Ansatz:

Mária Ercsey-Ravasz & Zoltán Toroczkai (2012), Das Chaos in Sudoku , Wissenschaftliche Berichte 2:75, Natur.

Die Idee basiert auf dem Begriff des vorübergehenden Chaos in einem dynamischen System.

In dynamischen Systemen gibt es beim Ändern des Zustands häufig einen Zeitraum, in dem ein transientes Signal dominiert, bevor es dem System gelingt, sich in eine stationäre Lösung zu versetzen. Wenn das dynamische System nichtlinear ist, kann der Übergang chaotisch sein.

Dies unterscheidet sich von einem chaotischen Attraktor (z. B. dem Lorentz-Attraktor) darin, dass der stationäre Zustand, zu dem das System schließlich hingezogen wird, nicht chaotisch ist, sondern nur die Transienten.

Die Zeit, die das System benötigt, bis die Transienten abklingen, wird als Fluchtrate bezeichnet . Die Autoren stellten fest, dass die Fluchtrate des Systems ziemlich korreliert, wenn Sie das Puzzle in ein SAT-Problem und dann in ein äquivalentes dynamisches System verwandeln (wobei der Attraktor des dynamischen Systems die Lösung für das SAT-Problem ist) gut damit, wie Sudoku-Rätsel für ihre Härte bewertet werden.

Das Interessante an diesem Ansatz ist, dass er unabhängig von Sudoku ist. Jedes Puzzle, das ziemlich direkt in ein SAT-Problem verwandelt werden kann (das SAT-Problem und das Puzzle können nicht zu weit auseinander gehen), kann auf die gleiche Weise analysiert werden.


Dies ist ein sehr interessanter Ansatz, danke für die Referenz. Ich verstehe nicht, warum es so gut funktionieren sollte, und es ist mir auch nicht klar, wie schwierig es ist, die Fluchtrate zu berechnen (außer vielleicht eine Schätzung durch Simulation), aber ich werde mir die Referenz ansehen und vielleicht auch komm zusammen.
user2566092

2

Wenn Sie die Härte eines Puzzles "für einen Menschen" messen möchten, sind die Inferenztechniken, die zur Vervollständigung des Puzzles erforderlich sind, ein typischer Ansatz. Beispielsweise können Sie Inferenzstrategien als Basis-, Zwischen- und Expertenstrategien kategorisieren.

Diese Methoden können alle auf einem Computer implementiert werden. Wenn der Computer das Rätsel mit nur einfachen Methoden lösen kann, ist das Rätsel einfach. Wenn Zwischentechniken benötigt werden, ist das Puzzle mittelgroß. Andernfalls benötigt der Computer Expertenstrategien, und das Rätsel ist schwierig. Ich habe ein Programm gesehen, das Rätsel basierend auf diesem Ansatz klassifiziert, aber anscheinend nicht an die genaue Referenz erinnert.

Alle Rätsel, die mit nur Inferenz gelöst werden können (keine Vermutung erforderlich), sind für einen Computer einfach. Wenn Sie sich für Rätsel interessieren, die für einen Computer schwierig sind, besteht eine Grundregel darin, dass sie irgendwann auf das Erraten zurückgreifen müssen. Die Erzeugung harter Sudoku-Rätsel (für einen Computer) wurde ebenfalls untersucht, und Sie können leicht relevante Papiere finden.


Dies scheint ein guter Ansatz zu sein, wenn den etwa 15 Inferenzregeln, die von Menschen verwendet werden, eine Härtebewertung zugewiesen werden könnte, die auf Trainingsdaten von Menschen basiert, die Rätsel lösen, und dann könnte die Rätselschwierigkeit entweder die Summe oder das Maximum der Härte für die Sequenz sein von Regeln erforderlich, um das Rätsel zu lösen. Der schwierige Teil scheint mir zu sein, wie Sie den Härtewert für jede einzelne Inferenzregel ableiten können, wenn die Lösungszeiten für ganze Rätsel angegeben sind, wenn Menschen sie lösen. Einige Regeln sollten auch eine variable Härte haben, wie "alternierende Inferenzkette", bei der es umso schwieriger wird, je länger die Kette ist.
user2566092

"Sudoku als Einschränkungsproblem" von Helmut Simonis ( 4c.ucc.ie/~hsimonis/sudoku.pdf ) ist ein Artikel, in dem Sudoku-Rätsel anhand der Schlussfolgerungen bewertet werden, die zum Lösen der Rätsel ohne Suche erforderlich sind.
Zayenz
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.