Ableiten der gesamten Streumatrix (innerhalb der Klasse + zwischen den Klassen)


14

Ich habe mit PCA- und LDA-Methoden herumgespielt und bin an einem Punkt festgefahren. Ich habe das Gefühl, dass es so einfach ist, dass ich es nicht sehen kann.

Innerhalb-Klasse ( SW ) und zwischen-Klasse ( SB ) scatter Matrices ist definiert als:

SW=i=1Ct=1N(xtiμi)(xtiμi)T

SB=i=1CN(μiμ)(μiμ)T

Die Gesamtstreumatrix ST ist gegeben als:

ST=i=1Ct=1N(xtiμ)(xtiμ)T=SW+SB

wobei C die Anzahl von Klassen und N die Anzahl von Abtastwerten ist, Abtastwerte sind, μ i der Klassenmittelwert ist, μxμiμ Gesamtmittelwert ist.

Bei dem Versuch, abzuleiten, kam ich zu einem Punkt, an dem ich:ST

(xμi)(μiμ)T+(μiμ)(xμi)T

als ein Begriff. Das muss Null sein, aber warum?


Tatsächlich:

ST=i=1Ct=1N(xtiμ)(xtiμ)T=i=1Ct=1N(xtiμi+μiμ)(xtiμi+μiμ)T=SW+SB+i=1Ct=1N[(xtiμi)(μiμ)T+(μiμ)(xtiμi)T]

2
Die Antwort ist, dass Sie die Abweichungen der Werte um ihren Mittelwert summieren und diese Summe Null ist. Aber was genau sind , m und m i ? Wie verhalten sich m und m i zu μ und μ i ? Die Qualität der Antworten hängt davon ab, wie genau wir raten, aber Sie zwingen uns, sehr viel zu raten! xmmimmiμμi
whuber

@whuber: Du hast vollkommen recht, ich habe meine Frage überarbeitet.
Nimcap

Antworten:


8

Wenn Sie annehmen

1Nt=1Nxti=μi

Dann

i=1Ct=1N(xtiμi)(μiμ)T=i=1C(t=1N(xtiμi))(μiμ)T=0

and formula holds. You deal with the second term in the similar way.


2
(+1) The second term, being the transpose of the first, must also be zero :-).
whuber

@whuber, yes, that too :)
mpiktas

Hi,i don't get why the assumption holds?Can someone explain that?
Mvkt

1
@Mvkt It is not so much an assumption as the definition of μi I suppose. That is to say: μi is the mean of the observations in group i. I expect the answer uses 'assume' because the OP doesn't explain the notation, so we have to guess that the group mean is meant by μi.
Vincent
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.