Ich bin neugierig auf die Natur von . Kann jemand etwas intuitives über "Was sagt Σ - 1 über Daten?"
Bearbeiten:
Danke für die Antworten
Nach einigen großartigen Kursen möchte ich einige Punkte hinzufügen:
- Es ist ein Maß für Information, dh ist eine Informationsmenge entlang der Richtung x .
- Dualität: Da positiv definit ist, gilt auch für Σ - 1 , dass es sich um Skalarproduktnormen handelt, genauer gesagt um Doppelnormen, sodass wir Fenchel dual für das regulierte Problem der kleinsten Quadrate ableiten und die Maximierung für dual durchführen können Problem. Wir können eine von ihnen wählen, abhängig von ihrer Konditionierung.
- Hilbert-Raum: Spalten (und Reihen) von und Σ erstrecken sich über den gleichen Raum. Es gibt also keinen Vorteil (außer wenn eine dieser Matrizen schlecht konditioniert ist) zwischen der Darstellung mit Σ - 1 oder Σ
- Frequentistische Statistik: Sie ist eng mit Fisher-Informationen verbunden, die die Cramér-Rao-Bindung verwenden. Tatsächlich ist die Fisher-Informationsmatrix (äußeres Produkt des Gradienten der logarithmischen Wahrscheinlichkeit mit sich selbst) Cramér-Rao-gebunden, dh (bezüglich positiver semidefiniter Kegel, iewrt Konzentration) Ellipsoide). Wenn also der Maximum-Likelihood-Schätzer effizient, dh die Daten enthalten ein Maximum an Informationen, sodass ein häufig auftretendes Regime optimal ist. In einfacheren Worten, für einige Wahrscheinlichkeitsfunktionen (man beachte, dass die funktionale Form der Wahrscheinlichkeit nur von dem wahrscheinlichen Modell abhängt, das angeblich Daten generiert, auch bekannt als generatives Modell), ist die maximale Wahrscheinlichkeit ein effizienter und konsistenter Schätzer und regiert wie ein Boss. (Entschuldigung für das Übermaß)