In Kapitel 2 des Matrix-Kochbuchs finden Sie eine schöne Übersicht über Matrix-Kalkül-Inhalte, die eine Menge nützlicher Identitäten enthält, die bei Problemen mit Wahrscheinlichkeits- und Statistikmessungen hilfreich sind, einschließlich Regeln zur Unterscheidung der multivariaten Gaußschen Wahrscheinlichkeit.
Wenn Sie einen Zufallsvektor , der multivariate Normalen mit dem mittleren Vektor und der Kovarianzmatrix , verwenden Sie Gleichung (86) im Matrixkochbuch, um herauszufinden, dass der Gradient der logarithmischen Wahrscheinlichkeit in Bezug auf istyΣ L μμΣLμ
∂L∂μ= - 12( ∂( y - μ )′Σ- 1( y - μ )∂μ)= - 12( - 2 Σ- 1( Y - μ ) )= Σ- 1( y - μ )
Ich überlasse es Ihnen, dies noch einmal zu differenzieren und die Antwort zu finden: .- Σ- 1
Verwenden Sie als "extra credit" die Gleichungen (57) und (61), um herauszufinden, dass der Gradient in Bezug auf istΣ
∂L∂Σ= - 12( ∂Log( | Σ | )∂Σ+ ∂( y - μ )′Σ- 1( y - μ )∂Σ)= - 12( Σ- 1- Σ- 1( y - μ ) ( y - μ )′Σ- 1)
Ich habe viele der Schritte ausgelassen, aber ich habe diese Ableitung nur unter Verwendung der im Matrix-Kochbuch gefundenen Identitäten vorgenommen, sodass ich es Ihnen überlassen werde, die Lücken auszufüllen.
Ich habe diese Bewertungsgleichungen für die Schätzung der maximalen Wahrscheinlichkeit verwendet, daher weiß ich, dass sie korrekt sind :)