Definition der gewichteten kleinsten Quadratgewichte: R lm Funktion vs.


9

Kann mir jemand sagen, warum ich durch Rgewichtete kleinste Quadrate und manuelle Lösung durch Matrixoperation unterschiedliche Ergebnisse erhalte ?

Insbesondere versuche ich, manuell zu lösen , wobei die Diagonalmatrix für Gewichte ist, die Datenmatrix ist, die Antwort ist Vektor. WAx=WbWAb

Ich versuche, die Ergebnisse mit der R lmFunktion unter Verwendung des weightsArguments zu vergleichen .

Geben Sie hier die Bildbeschreibung ein


Ich habe Tags bearbeitet: Dies war definitiv kein [Selbststudium]. Es geht auch nicht wirklich um GLS (sondern um einen ganz besonderen Fall), also habe ich auch diesen entfernt.
Amöbe

Antworten:


13

Wie Sie aus den mathematischen Ausdrücken für Ihre Berechnungen ersehen können, erhalten Sie

((WA)(WA))1((WA)(Wb))=(AW2A)1(AW2b).

Offensichtlich sind Ihre Gewichte , nicht . Daher sollten Sie Ihre Antwort mit der Ausgabe von vergleichenW2W

> lm(form, mtcars, weights=w^2)
Coefficients:
      wt        hp      disp  
14.12980   0.08391  -0.16446 

Die Übereinstimmung ist perfekt (innerhalb des Gleitkommafehlers - verwendet intern Reinen numerisch stabileren Algorithmus.)


1
Wir sprechen hier wohl nur von Software-Konventionen: Wenn die Software "Gewichte" erwartet, möchten Sie, dass Sie ihr oder ? Ich dachte, dies sei eine wertvolle Frage, da das Problem jedes statistische Paket betreffen könnte. Unabhängig von den Konventionen legt die kurze Analyse in dieser Antwort nahe, welche alternativen Interpretationen von "Gewichten" unter allen Umständen sinnvoll und experimentierwürdig sein könnten. WW2
whuber

Ja, ich finde es verwirrend, ich habe den Ausdruck aus Gilbert Strangs linearem Algebra-Buch Kapitel 8.6 erhalten, in dem er sagt, dass das gewichtete kleinste Quadrat nur eine Anpassung von zuAx=bWAx=Wb
Haitao Du

8
Strang ist richtig, aber er hat die pädagogische Ausrichtung rückwärts: Er beginnt eher mit der Antwort als mit dem Problem. Das Problem betrifft die Durchführung des Analogons eines Verfahrens der kleinsten Quadrate, wenn die Varianzen der Residuen bekannte, aber unterschiedliche Werte haben. Aus verschiedenen (aber einfachen) theoretischen Gründen sollten die Daten mit den inversen Varianzen gewichtet werden (manchmal als "Präzisionen" bezeichnet). Daraus kann man herausfinden, dass die Quadratwurzel der Gewichte sein muss. W
whuber
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.