Diese Frage hat mich lange Zeit verwirrt. Ich verstehe die Verwendung von "log" zur Maximierung der Wahrscheinlichkeit, daher frage ich nicht nach "log".
Meine Frage ist, warum wir diese NLL erfunden haben, da die Maximierung der Protokollwahrscheinlichkeit der Minimierung der "negativen Protokollwahrscheinlichkeit" (NLL) entspricht. Warum nutzen wir die "positive Wahrscheinlichkeit" nicht die ganze Zeit? Unter welchen Umständen wird NLL bevorzugt?
Ich habe hier eine kleine Erklärung gefunden. https://quantivity.wordpress.com/2011/05/23/why-minimize-negative-log-likelihood/ , und es scheint die offensichtliche Gleichwertigkeit in der Tiefe zu erklären, löst aber nicht meine Verwirrung.
Jede Erklärung wird geschätzt.