Wenn ich eine multivariate Normal IId Probe habe , und zu definieren d 2 i ( b , A ) = ( X i - b ) ' A - 1 ( X i - b ) (das ist eine Art Mahalanobis-Abstand [im Quadrat] von einem Abtastpunkt zum Vektor a unter Verwendung der Matrix A zur Gewichtung),
Ich betrachte eine Arbeit, die behauptet, sie sei , aber dies ist offensichtlich falsch: Die ≤ 2 p- Verteilung wäre für d 2 i ( μ , ≤ ) unter Verwendung des (unbekannten) Populationsmittelwertvektors und der Kovarianzmatrix erhalten worden. Wenn die Beispielanaloga eingesteckt sind, sollte man eine Hotelling T 2 -Verteilung oder eine skalierte F ( ⋅ ) -Verteilung oder so etwas erhalten, aber nicht die χ 2 p . Ich konnte das genaue Ergebnis weder in Muirhead (2005) noch in findenAnderson (2003) , noch in Mardia, Kent und Bibby (1979, 2003) . Anscheinend haben sich diese Typen nicht um die Diagnose von Ausreißern gekümmert, da die multivariate Normalverteilung perfekt ist und jedes Mal, wenn multivariate Daten erfasst werden, leicht ermittelt werden kann: - /.
Die Dinge können komplizierter sein. Das Hotelling -Verteilungsergebnis basiert auf der Annahme der Unabhängigkeit zwischen dem Vektorteil und dem Matrixteil; eine solche Unabhängigkeit gilt für ˉ X und S , aber es gilt nicht mehr für X i und S .