Angenommen, ich habe ein Bild von oben nach unten von einem Pfeil und möchte den Winkel vorhersagen, den dieser Pfeil bildet. Dies wäre zwischen und 360 Grad oder zwischen 0 und 2 π . Das Problem ist, dass dieses Ziel kreisförmig ist, 0 und 360 Grad sind genau das gleiche, was eine Invarianz ist, die ich in mein Ziel integrieren möchte, was die Verallgemeinerung erheblich unterstützen sollte (dies ist meine Annahme). Das Problem ist, dass ich keinen sauberen Weg sehe, dies zu lösen. Gibt es Papiere, die versuchen, dieses Problem anzugehen (oder ähnliche)? Ich habe einige Ideen mit ihren möglichen Nachteilen:
Verwenden Sie eine Sigmoid- oder Tanh-Aktivierung, skalieren Sie sie auf den Bereich ( und beziehen Sie die kreisförmige Eigenschaft in die Verlustfunktion ein. Ich denke, das wird ziemlich schwer scheitern, denn wenn es an der Grenze ist (schlechteste Vorhersage), wird nur ein kleines bisschen Lärm die Gewichte dazu bringen, in die eine oder andere Richtung zu gehen. Außerdem ist es schwieriger , Werte zu erreichen, die näher an der Grenze zwischen 0 und 2 π liegen, da der absolute Voraktivierungswert nahezu unendlich sein muss.
Stellen Sie zwei Werte ein, einen und einen y- Wert, und berechnen Sie den Verlust basierend auf dem Winkel, den diese beiden Werte bilden. Ich denke, dieser hat mehr Potenzial, aber die Norm dieses Vektors ist unbegrenzt, was zu numerischer Instabilität und zu Explosionen oder 0 während des Trainings führen kann. Dies könnte möglicherweise durch die Verwendung eines seltsamen Regularisierers behoben werden, um zu verhindern, dass diese Norm zu weit von 1 abweicht.
Andere Optionen würden etwas mit Sinus- und Cosinusfunktionen zu tun haben, aber ich denke, dass die Zuordnung mehrerer Voraktivierungen zu demselben Ausgang auch die Optimierung und Verallgemeinerung sehr schwierig macht.