Zunächst wurde mir klar, dass ich, wenn ich binäre Vorhersagen durchführen muss, mindestens zwei Klassen durch Ausführen einer One-Hot-Codierung erstellen muss. Ist das richtig? Gilt die binäre Kreuzentropie jedoch nur für Vorhersagen mit nur einer Klasse? Wenn ich einen kategorialen Cross-Entropy-Verlust verwenden würde, der normalerweise in den meisten Bibliotheken (wie TensorFlow) zu finden ist, gäbe es dann einen signifikanten Unterschied?
Was sind die genauen Unterschiede zwischen einer kategorialen und einer binären Kreuzentropie? Ich habe noch nie eine Implementierung der binären Kreuzentropie in TensorFlow gesehen, daher dachte ich, dass die kategoriale genauso gut funktioniert.