Am×nm≥nvAv1=argmaxv∈Rn∥Av∥2subject to ∥v∥2=1.(1)
v1Av2=argmaxv∈Rn∥Av∥2subject to ⟨v1,v⟩=0,∥v∥2=1.
v1,…,vnRnRnA
Sei (also quantifiziert die Sprengkraft von in der Richtung ). Angenommen, die Einheitsvektoren sind so definiert, dass
Die Gleichungen (2) können unter Verwendung der Matrixnotation kurz ausgedrückt werden als
wobei die Matrix ist, deren te Spalte , die Matrix ist, deren Die dritte Spalte ist undσi=∥Avi∥2σiAviuiAvi=σiuifor i=1,…,n.(2)
AV=UΣ,(3)
Vn×niviUm×niuiΣist die Diagonalmatrix, deren ter diagonaler Eintrag . Die Matrix ist orthogonal, also können wir beide Seiten von (3) mit multiplizieren , um
Es könnte den Anschein haben, dass wir die SVD von mit nahezu null Aufwand abgeleitet haben. Keiner der Schritte war bisher schwierig. Es fehlt jedoch ein entscheidender Teil des Bildes - wir wissen noch nicht, dass orthogonal ist.n×niσiVVTA=UΣVT.
AU
Hier ist die entscheidende Tatsache, das fehlende Teil: Es stellt sich heraus, dass orthogonal zu :
Ich behaupte, wenn dies nicht wahr wäre, dann wäre für problem (1) nicht optimal. In der Tat wäre es möglich, wenn (4) nicht erfüllt wäre, zu verbessern, indem es ein wenig in der Richtung .Av1Av2⟨Av1,Av2⟩=0.(4)
v1 v1v2
Angenommen (für einen Widerspruch), dass (4) nicht erfüllt ist. Wenn in der orthogonalen Richtung leicht gestört ist , ändert sich die Norm von nicht (oder zumindest ist die Änderung der Norm von vernachlässigbar). Wenn ich auf der Erdoberfläche wandle, ändert sich mein Abstand zum Erdmittelpunkt nicht. Wenn jedoch in Richtung gestört wird , die Vektor ist in dem gestörten nichtorthogonalen Richtung , und so die Änderung in der Norm von ist nicht vernachlässigbare . Die Norm vonv1v2v1v1v1v2Av1Av2Av1Av1kann um einen nicht zu vernachlässigenden Betrag erhöht werden. Dies bedeutet, dass für Problem (1) nicht optimal ist, was ein Widerspruch ist. Ich liebe dieses Argument, weil: 1) die Intuition sehr klar ist; 2) Die Intuition kann direkt in einen strengen Beweis umgewandelt werden.v1
Ein ähnliches Argument zeigt, dass sowohl zu als auch zu orthogonal ist und so weiter. Die Vektoren sind paarweise orthogonal. Dies bedeutet, dass die Einheitsvektoren paarweise orthogonal gewählt werden können, was bedeutet, dass die obige Matrix eine orthogonale Matrix ist. Damit ist unsere Entdeckung der SVD abgeschlossen.Av3Av1Av2Av1,…,Avnu1,…,unU
Um das obige intuitive Argument in einen strengen Beweis umzuwandeln, müssen wir die Tatsache konfrontieren, dass der gestörte Vektor , wenn in der Richtung gestört
wird, nicht wirklich ein Einheitsvektor ist. (Die Norm lautet .) Um einen strengen Beweis zu erhalten, definieren Sie
Der Vektor ist wirklich ein Einheitsvektor. Aber wie Sie leicht zeigen können, wenn (4) nicht erfüllt ist, haben wir
für ausreichend kleine Werte von
(unter der Annahme, dass das Vorzeichen vonv1v2v~1=v1+ϵv2
1+ϵ2−−−−−√v¯1(ϵ)=1−ϵ2−−−−−√v1+ϵv2.
v¯1(ϵ)ϵf(ϵ)=∥Av¯1(ϵ)∥22>∥Av1∥22
ϵist richtig gewählt). Um dies zu zeigen, überprüfen Sie einfach, ob . Dies bedeutet, dass für Problem (1) nicht optimal ist, was ein Widerspruch ist.f′(0)≠0v1
(Übrigens empfehle ich, die SVD-Erklärung von Qiaochu Yuan hier zu lesen. Sehen Sie sich insbesondere "Key lemma # 1" an, was wir oben besprochen haben. Wie Qiaochu sagt, ist "Key lemma # 1" das technische Herz der Singularwertzerlegung ".)