Ich habe das Modell für die logistische Regression für mehrere Klassen erhalten, das von gegeben ist
Dabei ist k die Anzahl der Klassen. Theta ist der zu schätzende Parameter. j ist die j-te Klasse. Xi sind die Trainingsdaten
Eine Sache, die ich nicht verstanden habe, ist, der Nenner Teil das Modell normalisiert hat. Ich meine, dadurch bleibt die Wahrscheinlichkeit zwischen 0 und 1.
Ich bin an logistische Regression gewöhnt
Eigentlich bin ich mit der Nomalisierungssache verwechselt. In diesem Fall, da es sich um eine Sigmoid-Funktion handelt, darf der Wert niemals kleiner als 0 oder größer als 1 sein. Aber ich bin im Fall mehrerer Klassen verwirrt. Wieso ist es so?
Dies ist meine Referenz https://list.scms.waikato.ac.nz/pipermail/wekalist/2005-February/029738.html . Ich denke, es hätte sein sollen, zu normalisieren