Ich denke, dass der Multi-Class-LDA-Klassifikator (gut, bei den meisten praktischen Aufgaben) immer den 2-Class-LDA übertrifft. Und ich werde versuchen zu beschreiben warum.
Schauen Sie sich den Beispieldatensatz an:
Sie haben hier drei Klassen. Angenommen, Sie möchten einen L-gegen-andere-Klassifikator mit LDA für die blaue Klasse erstellen.
Der geschätzte Mittelwert für die Klasse "blau" ist Null, aber der geschätzte Mittelwert für die Klasse "andere" ist ebenfalls Null. Und die Kovarianz ist dieselbe wie bei der Definition von LDA. Das bedeutet, dass LDA mit dem Etikett antwortet, das mehr Elemente enthält. Und es wird niemals die Klasse "blau" zurückgeben!
Für Multi-Class-LDA wird es gelingen, die richtigen Klassen perfekt zu finden.
Hintergrund ist, dass die Mischung der Gaußschen in den meisten Fällen keine Gaußsche mehr ist. Diese Annahme von LDA schlägt also fehl. Und ich muss sagen, es ist wirklich schwierig, ein Beispiel für einen Datensatz zu finden, in dem jede Klasse Gaußsch ist, und sie sind immer noch Gaußsch, nachdem wir uns ihnen angeschlossen haben.
Aus diesem Grund würde ich die Verwendung von LDA mit mehreren Klassen wärmstens empfehlen. Hoffe es wird helfen!