Vergleich der Varianz gepaarter Beobachtungen


16

Ich habe gepaarte Beobachtungen ( , ) aus einer gemeinsamen unbekannten Verteilung, die endliche erste und zweite Momente hat und um den Mittelwert symmetrisch ist.X i Y iNXiYi

Lassen Sie die Standardabweichung von (ohne Bedingung für ) und dieselbe für Y. Ich möchte die Hypothese testen X Y σ YσXXYσY

σ X = σ YH0 :σX=σY

σ Xσ YH1 :σXσY

Kennt jemand einen solchen Test? Ich kann zunächst annehmen, dass die Verteilung normal ist, obwohl der allgemeine Fall interessanter ist. Ich suche eine geschlossene Lösung. Bootstrap ist immer ein letzter Ausweg.


3
Ich bin nicht sicher, warum die Information, dass die Beobachtungen gepaart sind, für die getestete Hypothese wichtig ist. könntest du erklären?
Russellpierce

1
@drknexus ist wichtig, da die Abhängigkeit die Kalibrierung des Fisher-Tests erschwert.
Robin Girard

Antworten:


4

Sie könnten die Tatsache nutzen, dass die Verteilung der Stichprobenvarianz eine Chi-Quadrat-Verteilung ist, die auf der wahren Varianz zentriert ist. Nach Ihrer Nullhypothese wäre Ihre Teststatistik die Differenz zweier Chi-Quadrat-Zufallsvariablen, die auf derselben unbekannten wahren Varianz zentriert sind. Ich weiß nicht, ob der Unterschied zwischen zwei Chi-Quadrat-Zufallsvariablen eine identifizierbare Verteilung ist, aber obiges kann Ihnen in gewissem Maße helfen.


3
@svadali Es ist üblicher, hier das Verhältnis zu verwenden, da die Verteilung des Chi-Quadrat-Verhältnisses tabellarisch ist (Fisher's F). Der problematische Teil der Frage (dh die Abhängigkeit zwischen und Y ) ist jedoch immer noch da, was auch immer Sie verwenden. Es ist nicht einfach, einen Test mit zwei abhängigen Chi-Quadraten aufzubauen ... Ich habe versucht, eine Antwort mit einer Lösung zu diesem Punkt zu geben (siehe unten). XY
Robin Girard

7

Wenn Sie die nicht-parametrische Route abfahren möchten, können Sie immer den Test mit quadratischen Rängen versuchen.

Für den ungepaarten Fall lauten die Annahmen für diesen Test (von hier aus genommen ):

  1. Beide Stichproben sind Zufallsstichproben aus ihrer jeweiligen Population.
  2. Zusätzlich zur Unabhängigkeit innerhalb jeder Stichprobe besteht eine gegenseitige Unabhängigkeit zwischen den beiden Stichproben.
  3. Die Messskala ist mindestens Intervall.

Diese Vorlesungsunterlagen beschreiben den ungepaarten Fall im Detail.

Für den gekoppelten Fall müssen Sie diese Prozedur geringfügig ändern. In der Mitte dieser Seite sollten Sie eine Vorstellung davon bekommen, wo Sie beginnen sollen.


6

Der naive Ansatz , den ich denken kann, ist regredieren vs X i als Y i ~ m X i + b , dann einem durchführen t -Test auf der Hypothese , m = 1 . Siehe t-Test für die Regressionssteigung .YiXiYim^Xi+b^tm=1

Ein weniger naiver Ansatz ist der Morgan-Pitman-Test. Sei dann führe einen Test des Pearson-Korrelationskoeffizienten von U i gegen V i durch . (Man kann dies einfach mit der Fisher RZ-Transformation tun , die die Konfidenzintervalle um den Beispiel-Pearson-Koeffizienten angibt, oder über einen Bootstrap.)Uich=Xich-Y.ich,Vich=Xich+Y.ich,UichVich

Wenn Sie R verwenden und nicht alles selbst codieren möchten, würde ich das bootdpciRobust Stats-Paket von Wilcox, WRS, verwenden. (Siehe Wilcox 'Seite .)


4

Wenn Sie eine bivariate Normalität annehmen können, können Sie einen Likelihood-Ratio-Test entwickeln, der die beiden möglichen Kovarianzmatrixstrukturen vergleicht. Die uneingeschränkten (H_a) Maximalwahrscheinlichkeitsschätzungen sind allgemein bekannt - nur die Stichproben-Kovarianzmatrix, die eingeschränkten (H_0) können durch Ausschreiben der Wahrscheinlichkeit abgeleitet werden (und werden wahrscheinlich eine Art "gepoolte" Schätzung sein).

Wenn Sie die Formeln nicht ableiten möchten, können Sie SAS oder R verwenden, um ein Modell mit wiederholten Kennzahlen mit unstrukturierten und zusammengesetzten Kovarianzstrukturen für die Symmetrie anzupassen und die Wahrscheinlichkeiten zu vergleichen.


3

Die Schwierigkeit ergibt sich eindeutig daraus, dass und Y corelliert sind (ich nehme an, dass ( X , Y ) als Aniko gemeinsam gauß ist) und Sie keinen Unterschied machen können (wie in @ svadalis Antwort) oder ein Verhältnis (wie in Standard Fisher-Snedecor) "F-Test"), weil diese von der χ 2- Verteilung abhängen und weil Sie nicht wissen, um welche Abhängigkeit es sich handelt, die Verteilung unter H 0 schwer abzuleiten .XY(X,Y)χ2H0

Meine Antwort stützt sich auf die nachstehende Gleichung (1). Da der Unterschied in der Varianz mit einem Unterschied in den Eigenwerten und einem Unterschied im Drehwinkel faktorisiert werden kann, kann der Test der Gleichheit in zwei Tests zerlegt werden. Ich zeige, dass es möglich ist, den Fisher-Snedecor-Test zusammen mit einem Test am Hang zu verwenden, wie er von @shabbychef aufgrund einer einfachen Eigenschaft von 2D-Gauß-Vektoren vorgeschlagen wird.

i=1,2 (Z1i,,Znii)λ^i2λi2λ1=λ2

R=λ^X2λ^Y2
F(n11,n21)

R(θ)=[cosθsinθsinθcosθ]
λ1,λ2>0 ϵ1ϵ2N(0,λi2)

[XY]=R(θ)[ϵ1ϵ2]
Var(X)Var(Y)=(λ12λ22)(cos2θsin2θ)[1]

Var(X)=Var(Y)λ12=λ22θ=π/4mÖd[π/2]

λ12=λ22θ=π/4[modπ/2]|β1|=1Y=β1X+σϵYX

(λ12=λ22 or θ=π/4[modπ/2])αλ12=λ22α/3|β1|=1α/3

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.