Test auf signifikante Unterschiede in den Verhältnissen normalverteilter Zufallsvariablen

9

Bezogen auf das Analysieren von Verhältnissen von Variablen und Wie wird das Verhältnis von zwei normalverteilten Variablen oder die Umkehrung von einer parametrisiert? .

Angenommen, ich habe eine Reihe von Stichproben aus vier verschiedenen kontinuierlichen Zufallsverteilungen, von denen wir alle annehmen können, dass sie ungefähr normal sind. In meinem Fall entsprechen diese einigen Leistungsmetriken von zwei verschiedenen Dateisystemen (z. B. ext4 und XFS), sowohl mit als auch ohne Verschlüsselung. Die Metrik kann beispielsweise die Anzahl der pro Sekunde erstellten Dateien oder die durchschnittliche Latenz für einige Dateivorgänge sein. Wir können davon ausgehen, dass alle aus diesen Verteilungen gezogenen Stichproben immer streng positiv sind. Nennen wir diese Distributionen wobei und . $\textrm{Perf}_{fstype,encryption}$ $fstype \in \{xfs,ext4\}$ $encryption \in \{crypto,nocrypto\}$

Meine Hypothese ist nun, dass die Verschlüsselung eines der Dateisysteme um einen größeren Faktor verlangsamt als das andere. Gibt es einen einfachen Test für die Hypothese $\frac{E[\textrm{Perf}_{xfs,crypto}]}{E[\textrm{Perf}_{xfs,nocrypto}]} < \frac{E[\textrm{Perf}_{ext4,crypto}]}{E[\textrm{Perf}_{ext4,nocrypto}]}$ ?

distributions hypothesis-testing statistical-significance

— Sami Liedes
quelle

Ein Teil des Textes scheint aus der Mitte dieser Frage gelöscht worden zu sein. Glaubst du, du könntest es wiederherstellen?

— whuber

Ich denke, das "So, das" wurde versehentlich dort gelassen, zumindest kann ich mir nicht vorstellen, was ich dem hinzufügen wollte. Wahrscheinlich war es etwas, das ich schließlich zum zweiten Absatz überging.

— Sami Liedes

Sie könnten ein verallgemeinertes lineares Modell für eine Normalverteilung mit einer Protokollverknüpfungsfunktion anpassen.

— Onestop

1

"Anzahl der Dateien" und "durchschnittliche Latenz" können nicht normal verteilt werden (auch nicht negativ für den Anfang). Beide sind wahrscheinlich etwas richtig schief. Die Anzahl der Dateien ist eine diskrete Anzahl.

— Glen_b -Reinstate Monica

12

Eine Alternative zu StasKs feiner Antwort ist die Verwendung eines Permutationstests. Der erste Schritt besteht darin, eine Teststatistik zu definieren , vielleicht: $T$

$T = \frac{\widehat{Perf}_{ext4,crypto}}{\widehat{Perf}_{ext4,nocrypto}} - \frac{\widehat{Perf}_{xfs,crypto}}{\widehat{Perf}_{xfs,nocrypto}}$

Dabei ist möglicherweise der Stichprobenmittelwert der Beobachtungen von usw. (Dies passt zu Ihrer Definition der Hypothese als Verhältnis von eher die Erwartungen als die alternative Möglichkeit der Erwartung des Verhältnisses - welche Alternative könnte das sein, was Sie wirklich wollen.) Der zweite Schritt besteht darin, die Bezeichnungen in den Daten viele Male zufällig zu permutieren , z. B. , und berechne für jede Permutation. Der letzte Schritt besteht darin, Ihr ursprüngliches mit dem beobachteten zu vergleichen . die Permutation schätzt p-Wert würde der Bruchteil der sein . $\widehat{Perf}_{ext4,crypto}$ $\text{Perf}_{ext4,crypto}$ $ext4, \space xfs$ $i=1, \dots, 10000$ $T_i$ $T$ $T_i$ $T_i \leq T$

Der Permutationstest befreit Sie von der Abhängigkeit von Asymptotika, aber abhängig von Ihrer Stichprobengröße (und natürlich auch den Daten) funktioniert die Delta-Methode, die ich gelegentlich auch verwende, möglicherweise einwandfrei.

— jbowman
quelle

Das ist auch ein guter Vorschlag!

— StasK

Beachten Sie, dass das Verhältnis zweier zentrierter Normalvariablen eine Cauchy-Variable ist.

— Xi'an

1

@ Xi'an: Ist klar, dass wir hier davon ausgehen können, dass sie unabhängig sind? Wie Sie wissen, wäre dies notwendig, damit dieses Ergebnis erhalten bleibt (und die Chance besteht, nützlich zu sein).

— Kardinal

@ Cardinal: Ja, tatsächlich müssten sie unabhängig sein!

— Xi'an

1

Als sehr snobistischer technischer Punkt funktioniert die Permutation etwas besser, wenn Ihre Teststatistik entscheidend ist / keine unbekannten Parameter enthält / varianzstabilisiert ist ... zumindest unter Null. Mit Proportionen können Sie eine Bogensünde-Transformation durchführen. Bei streng positiven kontinuierlichen Mengen würde ich wahrscheinlich mit Protokollen beginnen. Aber das ist wirklich das i-Tüpfelchen.

— StasK

4

Sie können den (asymptotischen) Standardfehler des Verhältnisses mit der Delta-Methode berechnen . Wenn Sie zwei Zufallsvariablen und so dass in der Verteilung (was der Fall wäre, wenn Sie unabhängige Daten haben, aber es würde auch in einem allgemeineren Fall von gelten Clustered-Daten, wenn Sie Ihre Tests auf verschiedenen Maschinen ausgeführt haben), dann haben wir für das Verhältnis mit dem Populationsanalogon von $X$ $Y$

\sqrt{n} (\begin{matrix} \bar{X} - μ_{X} \\ \bar{Y} - μ_{Y} \end{matrix}) \to N ((\begin{matrix} 0 \\ 0 \end{matrix}), (\begin{array}{cc} σ_{X X} & σ_{X Y} \\ σ_{X Y} & σ_{Y Y} \end{array}))

$\sqrt{n}\left(\begin{array}{c} \bar X-\mu_X \\ \bar Y-\mu_Y\end{array}\right) \rightarrow N\left( \left( \begin{array}{c} 0 \\ 0 \end{array}\right), \left( \begin{array}{cc} \sigma_{XX} & \sigma_{XY} \\ \sigma_{XY} & \sigma_{YY} \end{array} \right) \right)$

r = \bar{Y} / \bar{X}

$r=\bar Y/\bar X$

r_{o} = μ_{Y} / μ_{X}

$r_o = \mu_Y/\mu_X$

\sqrt{n} (r - r_{0}) \to N (0, \frac{μ_{Y}^{2}}{μ_{X}^{4}} σ_{X X} - 2 \frac{μ_{Y}}{μ_{X}^{3}} σ_{X Y} + \frac{1}{μ_{X}^{2}} σ_{Y Y})

$\sqrt{n}(r-r_0) \to N(0,\frac{\mu_Y^2}{\mu_X^4}\sigma_{XX} - 2\frac{\mu_Y}{\mu_X^3}\sigma_{XY} + \frac1{\mu_X^2}\sigma_{YY})$ Wenn und unabhängig sind, wie in Ihrem Fall anzunehmen ist, vereinfacht sich dieser Ausdruck etwas, indem wird wir erhalten, dass die quadratischen Variationskoeffizienten sich summieren: Es hat die zusätzlicher Vorteil, dass die Stichprobengrößen unterschiedlich sein können. Wenn Ihre RHS und LHS unabhängig sind, können Sie außerdem die Test-Statistik für

X

$X$

Y

$Y$

σ_{X Y}

$\sigma_{XY}$

{C V}^{2} [r] = {C V}^{2} [\bar{X}] + {C V}^{2} [\bar{Y}]

${\rm CV}^2[r] = {\rm CV}^2[\bar X] + {\rm CV}^2[\bar Y]$

z

$z$

H_{0} :

$H_0:$ kein Unterschied, indem die Differenz der Verhältnisse genommen und durch den entsprechenden Standardfehler dividiert wird, der aus diesen Lebensläufen erhalten wird.

Ich hoffe, Sie können es von dort nehmen und die verbleibende Rückseite der Umschlagberechnungen durchführen, um die endgültige Formel zu erhalten.

Es ist zu beachten, dass das Ergebnis asymptotisch ist und das Verhältnis ein voreingenommener Schätzer von in kleinen Stichproben ist. Die Vorspannung hat die Größenordnung von und verschwindet asymptotisch im Vergleich zur Stichprobenvariabilität in der Größenordnung von . $r$ $r_0$ $O(1/n)$ $O(1/\sqrt{n})$

— StasK
quelle

Vielen Dank für die hervorragende und aufschlussreiche Antwort! Ich denke, ich werde den Permutationstest von jbowban für mein Studium auswählen, weil ich denke, dass ich ihn und seine Grenzen besser verstehe, aber die Delta-Methode sieht definitiv nach etwas aus, das ich studieren und herausfinden muss.

— Sami Liedes

@stask könnte das hier gemacht werden? stats.stackexchange.com/questions/398436/…

— Xavier Bourret Sicotte

Xavier, ich denke @ usεr11852 hat eine gute Antwort gegeben. Ich werde mich nicht darum kümmern.

— StasK

@StasK - Unter welchen Bedingungen sind die Bedingungen, die Sie in Ihrer Antwort angeben, gültig? Ist die Konvergenz der Verhältnisstatistik durch die vorherige Annahme und die Delta-Methode garantiert?

— Xavier Bourret Sicotte

Es ist asymptotisch ... nichts ist jemals garantiert, und Fehlergrenzen sind schwer bis unmöglich zu bekommen. Die Delta-Methode (oder jedes andere schwache Konvergenzergebnis) besagt lediglich, dass mit zunehmender Stichprobengröße die Differenz zwischen der tatsächlichen endlichen Stichprobenverteilung und der asymptotischen Verteilung kleiner wird. Dies kann bedeuten, dass sich die vertikale Differenz zwischen cdfs von 0,2 auf 0,1 verringert, wenn Sie die Stichprobengröße von 1000 auf 10000 erhöhen. Letzteres ist aus praktischen Gründen immer noch nicht akzeptabel. Oder es kann bedeuten, dass die Differenz von 0,01 bis 0,001 reicht.

— StasK

0

Das Verhältnis der Normalvariablen ist Cauchy verteilt. Wenn Sie das wissen, können Sie einfach einen Bayes-Faktor-Test durchführen.

Dies war eine eher spontane Idee. Ich bin mir jetzt nicht sicher über den Datenerzeugungsmechanismus. Installieren Sie verschiedene Dateisysteme auf demselben PC und vergleichen Sie dann die beiden Fälle, damit wir eine hierarchische Datenstruktur annehmen können?

Ich bin mir auch nicht sicher, ob es Sinn macht, Verhältnisse zu betrachten.

Und dann haben Sie das Verhältnis der erwarteten Werte geschrieben, während ich an den erwarteten Wert der Verhältnisse dachte. Ich denke, ich brauche mehr Informationen über die Datengenerierung, bevor ich fortfahre.

— Joint_P
quelle

1

Das Verhältnis der Normalen ist nur dann Cauchy, wenn (a) sie unabhängig sind und (b) die gleiche Varianz haben.

— Kardinal

Xi'an hatte den gleichen Gedanken, denke ich ...

— Joint_P

1

Es ist (zumindest für mich) nicht klar, dass eine solche Unabhängigkeitsstruktur existiert oder dass sie einen Mittelwert von Null haben werden. Wenn Sie Ihre Antwort erweitern können, hilft dies möglicherweise dabei, den von Ihnen vorgeschlagenen Ansatz klarer zu gestalten. :)

— Kardinal

1

@cardinal - Ich dachte, es sei ein Verhältnis unabhängiger Normalen mit einem Mittelwert von Null, das mit einem Median von Null und einem Skalenparameter gleich dem Verhältnis der normalen Standardabweichungen ist. Wenn sie einen Mittelwert ungleich Null haben, ist es nicht kauchig.

— Wahrscheinlichkeitslogik

@prob: (+1) Du hast recht! Danke, dass du das verstanden hast. Ich habe in meinem ersten Kommentar den "Standard" und den "Null-Mittelwert" gestrichen (letzterer hat es geschafft, es in meinen zweiten zu schaffen).

— Kardinal

0

In Fällen, in denen Sie keine Permutationen durchführen können, z. B. wenn die Stichprobengröße Millionen von Möglichkeiten bietet, wäre eine andere Lösung das Monte-Carlo-Resampling.

$ext4$ $xfs$ $nocrypto$ $crypto$ $\frac{ext4}{xfs}$ $nocrypto$ $crypto$

$H_{0}:T_{observed}=\frac{\sum x_{nocrypto} }{n_{nocrypto}}-\frac{\sum x_{crypto} }{n_{crypto}}=0$

$x=\frac{ext4}{xfs}$

$n=sample\, size$

$H_{0}$ $nocrypto$ $crypto$ $T_{observed}=0$

$T_{resampling}=\frac{x_{1}^{random}{+ x}_{n}^{random}}{n_{nocrypto}}-\frac{x_{1}^{random}{+ x}_{n}^{random}}{n_{crypto}}$

$T_{resampling}$ $H_{0}$ $nocrypto$ $crypto$ $T_{observed}$ $(p < 0.05)$ $T_{resampling}$

— user1979481
quelle