Die Kreuzentropie ist identisch mit der KL-Divergenz plus der Zielverteilungsentropie. KL ist gleich Null, wenn die beiden Verteilungen gleich sind. Dies scheint mir intuitiver zu sein als die Entropie der Zielverteilung.
Ich sage nicht, dass es in einem der anderen mehr Informationen gibt, außer dass eine menschliche Sichtweise eine Null intuitiver als eine positive findet. Natürlich verwendet man normalerweise eine Bewertungsmethode, um wirklich zu sehen, wie gut die Klassifizierung abläuft. Aber ist die Wahl der Kreuzentropie über KL historisch?