Stellen Sie sich ein Spiel vor, bei dem es sich neben einem roten und einem blauen Pixel um einen schwarzen Bildschirm handelt. Wenn sie dieses Spiel einem Menschen geben, werden sie zuerst sehen, dass durch Drücken der Pfeiltasten das rote Pixel verschoben wird. Als nächstes werden sie versuchen, das rote Pixel auf das blaue Pixel zu verschieben.
Geben Sie dieses Spiel einer KI, es bewegt das rote Pixel zufällig, bis eine Million Versuche später versehentlich auf das blaue Pixel verschoben werden, um eine Belohnung zu erhalten. Wenn die KI ein Konzept für den Abstand zwischen dem roten und dem blauen Pixel hätte, könnte sie versuchen, diesen Abstand zu minimieren.
Wenn wir die Pixel des Spiels nehmen, ohne das Konzept der Distanz tatsächlich zu programmieren, können wir dann eine Zahl (en) wie "Entropie" berechnen, die niedriger wäre, wenn die Pixel weit voneinander entfernt sind als wenn sie nahe beieinander liegen? Es sollte mit anderen Pixelkonfigurationen funktionieren. Zum Beispiel ein Spiel mit drei Pixeln, bei denen eines gut und eines schlecht ist. Nur um dem neuronalen Netzwerk ein besseres Gefühl dafür zu geben, wie der Bildschirm aussieht? Geben Sie dem NN dann ein Ziel, z. B. "Versuchen Sie, die Entropie des Bretts zu minimieren und Belohnungen zu erhalten".
Gibt es in der aktuellen Forschung etwas Ähnliches?