Wie man beweist, dass


9

Ich habe versucht, die Ungleichung festzustellen

|Ti|=|XiX¯|Sn1n

Dabei ist der Stichprobenmittelwert und die Standardabweichung der Stichprobe, dh . SS=X¯SS=i=1n(XiX¯)2n1

Es ist leicht zu erkennen, dass und so aber dies ist nicht sehr nahe an dem, wonach ich gesucht habe, und es ist auch keine nützliche Grenze. Ich habe mit den Cauchy-Schwarz- und den Dreiecksungleichungen experimentiert, bin aber nirgendwo hingegangen. Es muss einen subtilen Schritt geben, den ich irgendwo vermisse. Ich würde mich über Hilfe freuen, danke.| T i | < i=1nTi2=n1|Ti|<n1

Antworten:


10

Dies ist Samuelsons Ungleichung und benötigt das Zeichen. Wenn Sie die Wikipedia-Version nehmen und sie für die Definition von überarbeiten Sie feststellen, dass sie zun1S,

|XiX¯|Sn1n

Es ist eine strikte Ungleichung im Buch, aber ich habe es behoben, danke.
JohnK

5

Nachdem das Problem durch Routineverfahren vereinfacht wurde, kann es gelöst werden, indem es in ein duales Minimierungsprogramm umgewandelt wird, das eine bekannte Antwort mit einem elementaren Beweis hat. Vielleicht ist diese Dualisierung der "subtile Schritt", auf den sich die Frage bezieht. Die Ungleichung kann auch rein mechanisch durch Maximierung von festgestellt werden über Lagrange-Multiplikatoren.|Ti|

Zunächst biete ich jedoch eine elegantere Lösung an, die auf der Geometrie der kleinsten Quadrate basiert. Es erfordert keine vorläufige Vereinfachung und ist fast unmittelbar und liefert eine direkte Intuition in das Ergebnis. Wie in der Frage vorgeschlagen, reduziert sich das Problem auf die Cauchy-Schwarz-Ungleichung.


Geometrische Lösung

Betrachten Sie als einen dimensionalen Vektor im euklidischen Raum mit dem üblichen Punktprodukt. Sei der Basisvektor und . Schreiben Sie und für die orthogonalen Projektionen von und in das orthogonale Komplement von . (In der statistischen Terminologie sind sie die Residuen in Bezug auf die .) Dann, da undn y = ( 0 , 0 , ... , 0 , 1 , 0 , ... , 0 ) i th 1 = ( 1 , 1 , ... , 1 ) x y x y 1 X i - ˉ X =x=(X1,X2,,Xn)ny=(0,0,,0,1,0,,0)ith1=(1,1,,1)x^y^xy1S=| | x | | /XiX¯=x^yS=||x^||/n1 ,

|Ti|=n1|x^y|||x^||=n1|x^y^|||x^||

ist die Komponente von in der Richtung . Durch Cauchy-Schwarz wird es genau maximiert, wenn parallel zu , für die QED. x x y =(-1,-1,...,-1,n-1,-1,-1,...,-1)/nTi=±y^x^x^y^=(1,1,,1,n1,1,1,,1)/n

Ti=±n1y^y^||y^||=±n1||y^||=±n1n,

Im Übrigen bietet diese Lösung eine umfassende Charakterisierung aller Fälle, in denenwird maximiert: Sie sind alle von der Form|Ti|

x=σy^+μ1=σ(1,1,,1,n1,1,1,,1)+μ(1,1,,1)

für alle echten .μ,σ

Diese Analyse lässt sich leicht auf den Fall verallgemeinern, in dem durch eine beliebige Gruppe von Regressoren ersetzt wird. Offensichtlich ist das Maximum von proportional zur Länge des Residuums von ,.T i y | | y | |{1}Tiy||y^||


Vereinfachung

Da bei Änderungen von Ort und Maßstab unveränderlich ist, können wir ohne Verlust der Allgemeinheit annehmen, dass die Summe zu Null und ihre Quadrate zu summieren . Dies identifiziertmit, da (das mittlere Quadrat) . Das Maximieren ist gleichbedeutend mit dem Maximieren von . Auch durch geht keine Allgemeinheit verloren , da die austauschbar sind.X i n - 1 | T i | | X i | S 1 | T i | 2 = T 2 i = X 2 i i = 1 X iTiXin1|Ti||Xi|S1|Ti|2=Ti2=Xi2i=1Xi


Lösung über eine Doppelformulierung

Ein doppeltes Problem besteht darin, den Wert von und zu fragen, welche Werte der verbleibenden benötigt werden, um die Summe der Quadrate zu minimieren, , dass . Da angegeben ist, ist dies das Problem der Minimierung von , , .X12Xj,j1j=1nXj2j=1nXj=0X1j=2nXj2j=2nXj=X1

Die Lösung ist in vielerlei Hinsicht leicht zu finden. Eines der elementarsten ist das Schreiben

Xj=X1n1+εj, j=2,3,,n

für welche . Durch Erweitern der Zielfunktion und Verwenden dieser Summe-zu-Null-Identität zur Vereinfachung wird diese erzeugtj=2nεj=0

j=2nXj2=j=2n(X1n1+εj)2=(X1n1)22X1n1εj+εj2=Constant+εj2,

Das sofortige Anzeigen der eindeutigen Lösung ist für alle . Für diese Lösungεj=0j

(n1)S2=X12+(n1)(X1n1)2=(1+1n1)X12=nn1X12

und

|Ti|=|X1|S=|X1|n(n1)2X12=n1n,

QED .


Lösung über Maschinen

Kehren Sie zu dem vereinfachten Programm zurück, mit dem wir begonnen haben:

Maximize X12

vorbehaltlich

i=1nXi=0 and i=1nXi2(n1)=0.

Die Methode der Lagrange-Multiplikatoren (die fast rein mechanisch und unkompliziert ist) setzt eine nichttriviale lineare Kombination der Gradienten dieser drei Funktionen mit Null gleich:

(0,0,,0)=λ1D(X12)+λ2D(i=1nXi)+λ3D(i=1nXi2(n1)).

Komponente für Komponente sind diese Gleichungenn

0=2λ1X1+λ2+2λ3X10=λ2+2λ3X20=0=λ2+2λ3Xn.

Die letzten von ihnen implizieren entweder oder . (Wir können den letzteren Fall ausschließen, weil dann die erste Gleichung impliziert , wodurch die lineare Kombination trivialisiert wird.) Die Summe-zu-Null-Beschränkung erzeugt . Die Beschränkung der Quadratsumme liefert die beiden Lösungenn1X2=X3==Xn=λ2/(2λ3)λ2=λ3=0λ1=0X1=(n1)X2

X1=±n1n; X2=X3==Xn=1n.

Sie geben beide nach

|Ti|=|X1||±n1n|=n1n.

Vielen Dank für Ihren Nachtrag. Die Geometrie ist sehr leistungsfähig und von allen drei Lösungen für mich die intuitivste.
JohnK

0

Die angegebene Ungleichung ist wahr. Es ist intuitiv ziemlich klar, dass wir den schwierigsten Fall für die Ungleichung erhalten (dh die linke Seite für gegebenes maximieren ), indem wir einen Wert wählen, sagen wir so groß wie möglich, während alle anderen gleich sind. Schauen wir uns ein Beispiel mit einer solchen Konfiguration an:S2x1

n=4,x1=x2=x3=0,x4=4,x¯=1,S2=4,
jetzt abhängig von , während die angegebene Obergrenze gleich was gerade ist genug. Diese Idee kann zu einem Beweis vervollständigt werden.|xix¯|S={12 or 32i412=1.5

BEARBEITEN

Wir werden nun die Behauptung beweisen, wie oben angedeutet. Erstens können wir für jeden gegebenen Vektor in diesem Problem ihn durch ersetzen, ohne eine der Seiten der obigen Ungleichung zu ändern. Nehmen wir im Folgenden an, dass . Wir können auch durch erneutes Etikettieren annehmen, dass am größten ist. wir dann zuerst und dann wählen, können wir durch einfache Algebra überprüfen, ob wir Gleichheit in der behaupteten Ungleichung haben. Es ist also scharf.x=(x1,x2,,xn)xx¯x¯=0x1x1>0x2=x3==xn=x1n1

Definieren Sie dann den (konvexen) Bereich durch für eine gegebene positive Konstante . Beachten Sie, dass der Schnittpunkt einer Hyperebene mit einer am Ursprung zentrierten Kugel ist, ebenso wie eine Kugel im -Raum. Unser Problem kann jetzt als formuliert werden da einR = { x R : ˉ x = 0 , ( x i - ˉ x ) 2 / ( n - 1 ) S 2 } S 2 R ( n - 1 ) max x R max i | x i | x R | x 1 |R

R={xR:x¯=0,(xix¯)2/(n1)S2}
S2R(n1)
maxxRmaxi|xi|
xDies zu maximieren wird der schwierigste Fall für die Ungleichung sein. Dies ist ein Problem beim Finden des Maximums einer konvexen Funktion über einer konvexen Menge, was im Allgemeinen schwierige Probleme sind (Minima sind einfach!). In diesem Fall ist der konvexe Bereich jedoch eine Kugel, die auf dem Ursprung zentriert ist, und die Funktion, die wir maximieren möchten, ist der absolute Wert der Koordinaten. Es ist offensichtlich, dass dieses Maximum an der Grenzkugel von und durch Nehmen vonMaximal wird unser erster Testfall erzwungen.R|x1|

@ JohnK Sie können Ihre Kommentare jetzt löschen, der Beitrag ist korrigiert
kjetil b halvorsen

Obwohl diese Antwort zeigt, dass die Ungleichung (vorausgesetzt, sie ist wahr, was sie ist) eng ist , ist nicht ersichtlich, wie diese einzelne Berechnung "zu einem Beweis abgeschlossen" werden könnte. Könnten Sie einen Hinweis darauf geben, wie dies geschehen würde?
whuber

Will, aber morgen muss ich mich auf den morgigen Unterricht vorbereiten.
kjetil b halvorsen

Vielen Dank - ich schätze Ihre sorgfältige Formulierung des Problems. Aber Ihr "Beweis" scheint zu der Aussage zu kommen, dass "es offensichtlich ist, dass". Sie könnten immer Lagrange-Multiplikatoren anwenden, um den Job zu beenden, aber es wäre schön, einen Ansatz zu sehen, der (a) tatsächlich ein Beweis ist und (b) Einblick bietet.
whuber

2
@whuber Wenn Sie Zeit haben, würde ich mich freuen, wenn Sie Ihre Lagrange-Multiplikator-Lösung veröffentlichen können. Ich denke, die Ungleichheit ist insgesamt nicht so berühmt, wie sie sein sollte.
JohnK
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.