Angenommen, ich möchte eine binäre Klassifizierung durchführen (etwas gehört zu Klasse A oder Klasse B). Es gibt einige Möglichkeiten, dies in der Ausgabeschicht eines neuronalen Netzwerks zu tun:
Verwenden Sie 1 Ausgangsknoten. Ausgang 0 (<0,5) gilt als Klasse A und 1 (> = 0,5) gilt als Klasse B (bei Sigmoid)
Verwenden Sie 2 Ausgabeknoten. Die Eingabe gehört zu der Klasse des Knotens mit dem höchsten Wert / der höchsten Wahrscheinlichkeit (argmax).
Gibt es Papiere, die dies (auch) diskutieren? Nach welchen bestimmten Schlüsselwörtern muss gesucht werden?
Diese Frage wurde bereits zuvor auf dieser Site gestellt. Siehe z. B. diesen Link ohne echte Antworten. Ich muss eine Auswahl treffen (Masterarbeit), damit ich einen Einblick in die Vor- / Nachteile / Einschränkungen jeder Lösung bekomme.