Ich habe mit dem Neuralnetworksanddeeplearning dot com Tutorial angefangen, etwas über neuronale Netze zu lernen. Insbesondere im 3. Kapitel gibt es einen Abschnitt über die Kreuzentropiefunktion und definiert den Kreuzentropieverlust als:
Beim Lesen der Tensorflow-Einführung ist der Kreuzentropieverlust jedoch definiert als:
(bei Verwendung der gleichen Symbole wie oben)
Als ich mich dann umsah, um herauszufinden, was los war, fand ich einen weiteren Satz von Notizen: ( https://cs231n.github.io/linear-classify/#softmax-classifier ), der eine völlig andere Definition des Kreuzentropieverlusts verwendet, obwohl dies Zeit für einen Softmax-Klassifikator und nicht für ein neuronales Netzwerk.
Kann mir jemand erklären, was hier los ist? Warum gibt es übrigens Diskrepanzen? Als was definieren die Menschen den Kreuzentropieverlust? Gibt es nur ein übergeordnetes Prinzip?