Diese besondere Figur in Hastie et al. wurde ohne Berechnung von Gleichungen von Klassengrenzen hergestellt. Stattdessen wurde der in den Kommentaren durch @ttnphns umrissene Algorithmus verwendet, siehe Fußnote 2 in Abschnitt 4.3, Seite 110:
Für diese Figur und viele ähnliche Figuren im Buch berechnen wir die Entscheidungsgrenzen mit einer erschöpfenden Konturierungsmethode. Wir berechnen die Entscheidungsregel anhand eines feinen Punktgitters und verwenden dann Konturierungsalgorithmen, um die Grenzen zu berechnen.
Ich werde jedoch mit der Beschreibung fortfahren, wie Gleichungen von LDA-Klassengrenzen erhalten werden.
Beginnen wir mit einem einfachen 2D-Beispiel. Hier sind die Daten aus dem Iris-Datensatz . Ich verwerfe die Blütenblattmessungen und berücksichtige nur die Kelchblattlänge und -breite. Drei Klassen sind rot, grün und blau markiert:
Lassen Sie uns Klassenmittel (Zentroide) als . Die LDA geht davon aus, dass alle Klassen innerhalb der Klasse die gleiche Kovarianz aufweisen. Wenn die Daten gegeben sind, wird diese gemeinsame Kovarianzmatrix (bis zur Skalierung) als W = ∑ i ( x i - μ k ) ( x i - μ k ) ⊤ geschätzt , wobei die Summe über alle Datenpunkte und den Schwerpunkt des jeweiligen ist Klasse wird von jedem Punkt abgezogen.μ1,μ2,μ3W=∑i(xi−μk)(xi−μk)⊤
Für jedes Klassenpaar (zB Klasse und 2 ) gibt es eine Klassengrenze zwischen ihnen. Es ist offensichtlich, dass die Grenze durch den Mittelpunkt zwischen den beiden Klassenschwerpunkten ( μ 1 + μ 2 ) / 2 verlaufen muss . Eines der zentralen LDA-Ergebnisse ist, dass diese Grenze eine zu W - 1 ( μ 1 - μ 2 ) orthogonale Gerade ist . Es gibt mehrere Möglichkeiten, um dieses Ergebnis zu erhalten, und obwohl dies nicht Teil der Frage war, möchte ich im Anhang unten drei davon kurz erwähnen.12(μ1+μ2)/2W−1(μ1−μ2)
Beachten Sie, dass das, was oben geschrieben wurde, bereits eine genaue Spezifikation der Grenze ist. Wenn man eine Geradengleichung in der Standardform haben möchte , dann können die Koeffizienten a und b berechnet werden und werden durch einige unordentliche Formeln angegeben. Ich kann mir kaum eine Situation vorstellen, in der dies nötig wäre.y=ax+bab
Wenden wir diese Formel nun auf das Beispiel Iris an. Für jedes Klassenpaar finde ich einen Mittelpunkt und zeichne eine Linie senkrecht zu :W−1(μi−μj)
Wie zu erwarten, schneiden sich drei Linien in einem Punkt. Entscheidungsgrenzen werden durch Strahlen gegeben, die vom Schnittpunkt ausgehen:
K≫2K(K−1)/2
D>2W−1(μ1−μ2)(μ1+μ2)/2D−1
Blinddarm
W−1(μ1−μ2)
W−1μ1−μ2
xk(x−μk)⊤W−1(x−μk)12x⊤W−1(μ1−μ2)=const
Wμ1−μ2WW=UDU⊤S=D−1/2U⊤SS(μ1−μ2)S−1S⊤S(μ1−μ2)S