Da es sich bei der Behauptung im Zitat um eine Sammlung von Aussagen zur Neuskalierung der Spalten von , können Sie sie auch alle auf einmal beweisen. In der Tat braucht es keine Arbeit mehr, um eine Verallgemeinerung der Behauptung zu beweisen:X.
Wenn ist rechts multipliziert mit einer invertierbaren Matrix A , dann wird die neue Koeffizientenschätzung β A gleichX.EINβ^EIN durch Links multipliziertA-1.β^EIN- 1
Die einzigen algebraischen Fakten, die Sie benötigen, sind die (leicht zu beweisenden, bekannten), dass für alle Matrizen A B und ( A B ) - 1 = B - 1 A - 1 für invertierbare Matrizen A und B . (Eine subtilere Version der letzteren wird benötigt, wenn mit verallgemeinerten Inversen gearbeitet wird: für invertierbares A und B und jedes X , ( A X B )( A B )'= B.'EIN'A B.( A B )- 1= B.- 1EIN- 1EINB.EINB.X. )( A X.B )- -= B.- 1X.- -EIN- 1
Proof algebraisch : β A = ( ( X A ) ' ( ( X A ) ) - ( X A ) ' y = A - 1 ( X ' X ) - ( A ' ) - 1 A ' y = A - 1 β ,
β^EIN= ( ( X.A )'( ( X.A ) )- -( X.A )'y= A.- 1( X.'X.)- -( A.')- 1EIN'y= A.- 1β^,
QED. (Damit dieser Beweis vollständig allgemeinen sein, die - oberer Index bezieht sich auf eine verallgemeinerte inverse) .- -
Beweis durch Geometrie :
Gegeben Basen und E n von R n und R p jeweils X für eine lineare Transformation von R p bis R n . Die Rechtsmultiplikation von X mit A kann so betrachtet werden, dass diese Transformation fest bleibt, aber E p zu A E p (dh zu den Spalten von A ) geändert wird . Nach dieser Änderung der Grundlage der Darstellung der jeder Vektor & bgr; ∈ RE.pE.nR.nR.pX.R.pR.nX.EINE.pA E.pEIN muss sich durch Linksmultiplikation mit A - 1 ,QEDändern.β^∈ R.pEIN- 1
(Dieser Beweis funktioniert unverändert, auch wenn nicht invertierbar ist.)X.'X.
Das Zitat bezieht sich speziell auf den Fall von Diagonalmatrizen mit A i i = 1 für i ≠ j und A j j = c .EINEINi i= 1i ≠ jEINj j= c
Verbindung mit kleinsten Quadraten
Das Ziel hierbei ist es, erste Prinzipien zu verwenden, um das Ergebnis zu erhalten, wobei das Prinzip das der kleinsten Quadrate ist: Schätzen von Koeffizienten, die die Summe der Quadrate von Residuen minimieren.
Auch hier erweist sich der Nachweis einer (großen) Verallgemeinerung als nicht schwieriger und eher aufschlussreich. Angenommen, ist eine beliebige Abbildung (linear oder nicht) von reellen Vektorräumen, und angenommen, Q ist eine beliebige reelle Funktion auf W n . Sei U ⊂ V p die (möglicherweise leere) Menge von Punkten v, für die
ϕ : V.p→ W.n
Q.W.nU.⊂ V.pv minimiert ist.
Q ( ϕ ( v ) )
Ergebnis: , das ausschließlich durch Q und ϕ bestimmt wird , hängt nicht von einer Wahl der Basis abU.Q.ϕ die zur Darstellung von Vektoren in V p verwendet wird .E.pV.p
Beweis: QED.
Es gibt nichts zu beweisen!
Anwendung des Ergebnisses: Sei eine positive semidefinite quadratische Form auf R n , sei y ∈ R n und sei ϕ eine lineare Karte, die durch X dargestellt wird, wenn Basen von V p = R p und W n = R n gewählt werden. Definiere Q ( x ) = F ( y , x ) . Wählen Sie eine Basis von R p ist die Darstellung einiger v ∈ U.F.R.ny∈ R.nϕX.V.p= R.pW.n= R.nQ ( x ) = F.( y, x )R.p und nehmen wir an ββ^v ∈ U. auf dieser Basis. Dies ist der kleinsten Quadrate : minimiert den quadrierten Abstand F ( y , x ) . Da X eine lineare Abbildung, die Basis des Ändern R p entsprechen rechte Multiplikation X durch eine invertierbare Matrix A . Das wird linksmehrfach β von A - 1 , QED .x = X.β^F.( y, x )X.R.pX.EINβ^EIN- 1