TL; dr
Die nicht diagonalen Einträge der Stichproben-Kovarianz werden im Allgemeinen mit den diagonalen Einträgen korreliert, da nur dann gilt, wenn spezielle Bedingungen für die gemischten Momente 4. Ordnung gelten. Wenn bivariate Gaußsche Werte sind, gelten diese Bedingungen nur, wenn von unabhängig ist .E(XY3)−E(XY)E(Y2)=0(X,Y)XY
Einzelheiten
Es gibt ein asymptotisches Ergebnis, das hier gezeigt werden kann, indem die Grenzverteilung von mal der Probenkovarianz untersucht wird (nach der CLT wird es multivariate Normalen sein) und dann die Delta-Methode angewendet wird. Dies bedeutet leider, dass wir einen Umweg über eine Ableitung der Verteilung der Stichproben-Kovarianz machen müssen da ich online keine guten Referenzen dazu finden kann. Wenn Sie bereit sind, Normalität anzunehmen, können Sie mit Kenntnis der Kovarianz der Wishart-Verteilung direkt zu Abschnitt 2 springen.n−−√1
1 Die asymptotische Verteilung der Probenkovarianz
Sei eine iid-Stichprobe aus einer bivariaten Verteilung mit endlichen vierten Momenten und sei
Ohne Verlust der Allgemeinheit und um lästige zusätzliche Buchhaltung zu vermeiden, nehmen wir
. V1,…,VnVi=(XiYi)Cov(Vi)=(σ2ρστρσττ2)=Σ.
E(Vi)=0
Dann ist durch die Linearität der Erwartung und das schwache Gesetz großer Zahlen die Stichproben-Kovarianz
ist unvoreingenommen und konsistent für und tatsächlich
Sn=1n−1∑i=1n(Vi−V¯n)(Vi−V¯n)T=1n−1∑i=1ViVTi−nn−1V¯nV¯Tn
Σn−−√(Sn−Σ)→dN(0,Λ).
Die Übung geht somit zur Bestimmung von . Für eine symmetrische Matrix , lassen sein , die "Vektorisierung" seines oberen Dreiecks. Betrachten Sie nun ein einzelnes Element des Durchschnitts, das in den führenden Term (die Streumatrix) von :
Durch die Null-Mittelwert-Annahme, dass bereits und durch Berücksichtigung der Potenzen von und , die in , können wir einfach schreiben
ΛA=(abbc)A~=(a,b,c)TSnZ~i=ViVTi˜=⎛⎝⎜X2iXiYiY2i⎞⎠⎟.
E(Zi)=Σ~XYZ~iZ~TiCov(Z~i)=E(Z~iZ~Ti)−E(Z~i)E(Z~i)T=⎛⎝⎜κ40σ4κ31σ2τκ22σ2τ2κ31σ2τκ22σ2τ2κ13στ3κ22σ2τ2κ13στ3κ04τ4⎞⎠⎟−Σ~Σ~T.
Hier gibt das an gemischtes standardisiertes Moment (ungefähr der Mittelwert, aber wir haben zu Beginn den Mittelwert Null angenommen).κij=E[(Xiσ)i(Yiτ)j]
ij
Alternativ haben wir die Faktorisierung
wobei , und
Cov(Z~i)=D(σ,τ)[K−R(ρ)R(ρ)T]D(σ,τ),(1)
D(σ,τ)=diag(σ2,στ,τ2)R(ρ)=(1,ρ,1)TK=⎛⎝⎜κ04κ31κ22κ31κ22κ13κ22κ13κ04⎞⎠⎟.
Wir haben also, dass und , die die Stichprobenvarianz von und die Kovarianz von korreliert sind, es sei denn, . Wenn multivariat normal ist, tritt dies nur auf, wenn .Z11Z12XX,Yρ=κ31Viρ=0
2 Der Korrelationskoeffizient
Betrachten Sie nun die Transformation auf . Dies liefert die bivariate Verteilung des Probenkorrelationskoeffizienten und der Probenvarianz von x. Nach der Delta-Methode und der asymptotischen Normalität von ist
wobei ist der Jacobi von .g(x,y,z)=(x,yz√x√)Sn~Snn−−√(g(Sn~)−(ρ,σ2)T)→N(0,J(Σ~)TΛ~J(Σ~)),
J(Σ~)=[∇gT1,∇gT2]Tg
Ich finde , (obwohl Sie wahrscheinlich wollen meine Algebra überprüfen ..) , dass der Gradient der zweiten Komponente von heißt
So
g∇g2(σ2,ρστ,τ2)=(−ρ2σ2,1στ,−ρ2τ2)T,
J(σ,ρ,τ)=⎛⎝⎜⎜100−ρ2σ21στ−ρ2τ2⎞⎠⎟⎟.
Alles zusammen mit der Faktorisierung in Gleichung (1) ergibt
J(σ,ρ,τ)TD(σ,τ)[K−R(ρ)R(ρ)T]D(σ,τ)J(σ,ρ,τ).
Wenn Sie einige einfach zu verwendende Zahlen eingeben , z. B. und , hätten wir für
wobei im Allgemeinen eine dichte Matrix ist. Mit freundlicher Genehmigung von Mathematica habe ich dieses Produkt in Bezug auf Einträge in und unterσ=τ=1ρ=.5J(σ,ρ,τ)TD(σ,τ)[K−R(ρ)R(ρ)T]D(σ,τ)J(σ,ρ,τ)=(−1/4110−1/40)IΩI⎛⎝⎜−1/41−1/4100⎞⎠⎟=Q,
Ω=K−R(ρ)R(ρ)TKQ12
n×Q12=n×Cov(r,s2x)=κ31−κ04+κ224(2)
Das ist ein undurchsichtiger Ausdruck in Bezug auf die gemischten Momente, aber es scheint sicher nicht so, als würde es im Allgemeinen Null sein.
3 Spezialisiert auf den Normalfall
Das Isserlis-Theorem bietet eine Möglichkeit, die gemischten Momente eines Gaußschen abzuleiten. Wieder unter der Annahme von und wir
, also
, wie Sie beobachten.σ=τ=1ρ=.5κ31=3/2,κ04=3,κ22=3/2Q12=3/2−(3+3/2)/4=3/8>0
4 Simulation und Beispiel
Unten finden Sie eine Simulation zur Überprüfung von Gleichung (1). Für und (in rot bzw. blau) iid Beobachtungen aus einer multivariaten Normalen leite ich die Kovarianz von durch Bootstrap ab. Die Kovarianz zwischen und auf der Y - Achse aufgetragen , wie von variiert bis . Der theoretische Wert aus Gleichung (1) und die Verwendung von Fakten über die Momente 4. Ordnung des bivariaten Gaußschen ist in einer gestrichelten schwarzen Linie dargestellt.n=100n=1000n−−√S~nSxySxxρ−.9.9
Ein Spaß Übung wäre, zu versuchen , eine Familie von Copula zu finden , dass für einen beliebigen Wert von machen würde ...ρCov(Sxy,Sxx)=0
library(mvtnorm)
library(tidyverse)
library(boot)
params = expand.grid(sx = 1, sy = 1, n = c(100, 1000), rho = seq(-.9, .9, by = .1), replicate = 1:10) %>% mutate(k04 = 3*sx^4, k31 = 3*sx*rho*sx*sy, q12 = k31 - rho*sx*sy)
Sn_tilde = function(dat, idx){
Sn = cov(dat[idx,,drop =FALSE])*sqrt(length(idx))
Sn[upper.tri(Sn, diag = TRUE)]
}
out = params %>% group_by_all() %>% do({
x = with(., rmvnorm(n = .$n, sigma = matrix(c(sx^2, rho*sx*sy,
rho*sx*sy, sy^2), nrow = 2)))
colnames(x) = c('X', 'Y')
b = boot(x, Sn_tilde, R = 500)
cov_Sn = cov(b$t)
rownames(cov_Sn) = colnames(cov_Sn) = c('Sxx', 'Sxy', 'Syy')
as_tibble(cov_Sn, rownames = 'j')
})
ggplot(filter(out, j == 'Sxx'), aes(x = rho, y = Sxy, color = factor(n))) + geom_point(size = .5, alpha = .5) + geom_smooth(method = 'lm') + geom_line(data = filter(params, replicate == 1, n == 100), aes(y = q12), lty = 2, color = 'black') + theme_minimal() + ylab('Cov(Sxy, Sxx)')
1 Hierbei werden Michael Perlmans Vorlesungsunterlagen zu Wahrscheinlichkeits- und mathematischen Statistiken verwendet, von denen ich mir wirklich wünschte, sie wären elektronisch verfügbar, damit ich meine ersetzen könnte, wenn sie abgenutzt sind ...