Diese Frage befasst sich mit der eingeschränkten Maximalwahrscheinlichkeitsschätzung (REML) in einer bestimmten Version des linearen Modells, nämlich:
Wobei eine durch ; parametrisierte ( ) Matrix ist , wie auch . ist ein unbekannter Vektor von Störparametern; das Interesse liegt in der Schätzung von , und wir haben . Das Modell nach der maximalen Wahrscheinlichkeit abzuschätzen ist kein Problem, aber ich möchte REML verwenden. Es ist bekannt, siehe z. B. LaMotte , dass die Wahrscheinlichkeit , wobei eine beliebige Matrix ist, so dass geschrieben werden kann
wenn volle Spaltenrang ist .
Mein Problem ist, dass für einige absolut vernünftige und wissenschaftlich interessante die Matrix nicht den vollen Spaltenrang hat. Alle Ableitungen, die ich von der oben genannten eingeschränkten Wahrscheinlichkeit gesehen habe, verwenden Determinantengleichungen, die nicht anwendbar sind, wenn , dh sie nehmen den vollen Spaltenrang von . Dies bedeutet, dass die obige eingeschränkte Wahrscheinlichkeit nur für meine Einstellung auf Teile des Parameterraums richtig ist und daher nicht das ist, was ich optimieren möchte.X ( α ) | X ' X | = 0 X
Frage: Gibt es allgemeinere eingeschränkte Wahrscheinlichkeiten, die in der statistischen Literatur oder anderswo abgeleitet wurden, ohne die Annahme, dass der volle Spaltenrang ist? Wenn ja, wie sehen sie aus?
Einige Beobachtungen:
- Das Ableiten des exponentiellen Teils ist für jedes kein Problem, und es kann in Form der Moore-Penrose-Inverse wie oben beschrieben geschrieben werden
- Die Spalten von sind eine (beliebige) orthonormale Basis fürC ( X ) ⊥
- Für bekanntes kann die Wahrscheinlichkeit für leicht für jedes Alpha notiert werden , aber natürlich hängt die Anzahl der Basisvektoren, dh der Spalten, in A vom Spaltenrang von X abA ' Y α A X
Wenn jemand, der sich für diese Frage interessiert, der Meinung ist, dass die genaue Parametrisierung von hilfreich ist, lass es mich wissen und ich werde sie aufschreiben. An dieser Stelle bin ich jedoch hauptsächlich an einem REML für ein allgemeines mit den richtigen Abmessungen interessiert .
Eine detailliertere Beschreibung des Modells folgt hier. Sei einr dimensionale Vektorautoregression erster Ordnung [VAR (1)], wobei . Angenommen, der Prozess wird in einem festen Wert zum Zeitpunkt gestartet .y 0 t = 0
Definiere . Das Modell kann in der linearen Modellform Verwendung der folgenden Definitionen und Notation geschrieben werden: Y = X β + ε
wobei bezeichnet dimensionaler Vektor von Einsen und der erste Standard Basisvektor von .
Bezeichne . Beachten Sie, dass, wenn kein voller Spaltenrang ist kein voller Rang ist. Dies schließt zum Beispiel Fälle ein, in denen eine der Komponenten von nicht von der Vergangenheit abhängt.
Die Idee der Schätzung von VARs unter Verwendung von REML ist beispielsweise in der Literatur zu prädiktiven Regressionen gut bekannt (siehe z. B. Phillips und Chen und die darin enthaltenen Referenzen).
Es kann sich lohnen, klarzustellen, dass die Matrix keine Entwurfsmatrix im üblichen Sinne ist, sondern nur aus dem Modell herausfällt und es keine gibt a priori - Wissen über ist, soweit ich das beurteilen kann, keine Möglichkeit zu parametrieren es ist voller Rang.
Ich habe eine Frage zu math.stackexchange gestellt , die sich auf diese in dem Sinne bezieht, dass eine Antwort auf die mathematische Frage hilfreich sein kann, um eine Wahrscheinlichkeit abzuleiten, die diese Frage beantworten würde.