Kurze Antwort
Die Wahrscheinlichkeitsdichte eines multivariaten gaußverteiltes variable x=(x1,x2,...,xn) , mit einem Mittelwert μ=(μ1,μ2,...,μn) zu dem Quadrat der verwandte der euklidische Abstand zwischen dem Mittelwert und der Variablen ( |μ−x|22 ) oder mit anderen Worten die Summe der Quadrate.
Lange Antwort
Wenn Sie mehrere Gaußsche Verteilungen für Ihre n Fehler multiplizieren , wobei Sie gleiche Abweichungen annehmen, erhalten Sie eine Summe von Quadraten.
L ( μj, xi j) =P.( xi j| μj)= ∏ni = 112 πσ2√e x p [ - ( xi j- μich)22 σ2]]= ( 12 πσ2√)ne x p [ - ∑ni = 1( xi j- μich)22 σ2]]
oder in der bequemen logarithmischen Form:
Log( L ( μj, xi j) ) =nlog( 12 πσ2- -- -- -- -√) - 12 σ2∑i = 1n( xi j- μj)2
Die Optimierung des μ zur Minimierung der Quadratsumme entspricht also der Maximierung der (logarithmischen) Wahrscheinlichkeit (dh des Produkts mehrerer Gaußscher Verteilungen oder der multivariaten Gaußschen Verteilung).
Es ist dieses verschachtelte Quadrat der Differenz ( μ - x ) innerhalb der Exponentialstruktur e x p [ ( xich- μ )2]] , das andere Verteilungen nicht haben.
Vergleichen Sie zum Beispiel mit dem Fall für Poisson-Verteilungen
Log( L ) = log( ∏ μxi jjxi j!e x p [ - μj] ) =-∑ μj- ∑ l o g( xi j! ) + ∑ l o g( μj) xi j
Das hat ein Maximum, wenn Folgendes minimiert wird:
∑μj−log(μj)xij
Das ist ein anderes Tier.
Zusätzlich (Geschichte)
Die Historie der Normalverteilung (wobei deMoivre ignoriert wird, um diese Verteilung als Annäherung für die Binomialverteilung zu erhalten) ist tatsächlich die Entdeckung der Verteilung, die die MLE der Methode der kleinsten Quadrate entspricht (und nicht der Methode der kleinsten Quadrate als Methode das kann die MLE der Normalverteilung ausdrücken, zuerst kam die Methode der kleinsten Quadrate, zweitens kam die Gaußsche Verteilung)
Beachten Sie, dass Gauß, der die 'Methode der maximalen Wahrscheinlichkeit' mit der 'Methode der kleinsten Quadrate' verbindet, die 'Gaußsche Verteilung' e−x2 als einzige Fehlerverteilung gefunden hat, die uns dazu führt, diese Verbindung zwischen herzustellen die beiden Methoden.
Aus der Übersetzung von Charles Henry Davis (Theorie der Bewegung der Himmelskörper, die sich in konischen Abschnitten um die Sonne bewegen. Eine Übersetzung von Gauß '"Theoria motus" mit Anhang) ...
Gauß definiert:
Dementsprechend wird die Wahrscheinlichkeit , jedem Fehler Δ ; zugeordnet zu werden, durch eine Funktion von ΔDgr; ausgedrückt, die wir mit & ψΔ Dgr; bezeichnen werden .
(Kursivierung von mir gemacht)
Und fährt fort ( in Abschnitt 177, S. 258 ):
ψ′ΔΔklog ψΔ=12kΔΔ+Constant
ψΔ=xe12kΔΔ
eConstant=logx
k<0
ψΔ=hπ−−√e−hhΔΔ
Geschrieben von StackExchangeStrike