Wie parametriere ich das Verhältnis zweier normalverteilter Variablen oder die Umkehrung einer Variablen?


12

Problem: Ich parametrisiere Verteilungen zur Verwendung als Prioritäten und Daten in einer Bayes'schen Metaanalyse. Die Daten werden in der Literatur als zusammenfassende Statistiken bereitgestellt, von denen fast ausschließlich angenommen wird, dass sie normal verteilt sind (obwohl keine der Variablen <0 sein kann, einige Verhältnisse sind, andere Massen sind und usw.).

Ich bin auf zwei Fälle gestoßen, für die ich keine Lösung habe. Manchmal ist der interessierende Parameter die Inverse der Daten oder das Verhältnis zweier Variablen.

Beispiele:

  1. das Verhältnis zweier normalverteilter Variablen:
    • Daten: Mittelwert und SD für Prozent Stickstoff und Prozent Kohlenstoff
    • Parameter: Verhältnis von Kohlenstoff zu Stickstoff.
  2. die Umkehrung einer normalverteilten Variablen:
    • Daten: Masse / Fläche
    • Parameter: Fläche / Masse

Mein derzeitiger Ansatz ist die Verwendung der Simulation:

zB für einen Satz von Kohlenstoff- und Stickstoff-Prozentdaten mit Mittelwerten: xbar.n, c, Varianz: se.n, c und Probengröße: nn, nc:

set.seed(1)
per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C
per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N

Ich möchte ratio.cn = perc.c / perc.n parametrieren

# parameter of interest
ratio.cn <- perc.c / perc.n

Wählen Sie dann die am besten passenden Verteilungen mit dem Bereich für meinen Prior0

library(MASS)
dist.fig <- list()
for(dist.i in c('gamma', 'lognormal', 'weibull')) {
    dist.fit[[dist.i]] <- fitdist(ratio.cn, dist.i)
}

Frage: Ist das ein gültiger Ansatz? Gibt es andere / bessere Ansätze?

Danke im Voraus!

Update: Die Cauchy-Verteilung, die als Verhältnis zweier Normalen mit , ist nur bedingt anwendbar, da ich die Varianz schätzen möchte. Vielleicht könnte ich die Varianz einer Simulation von n Zügen aus einem Cauchy berechnen?μ=0

Ich habe folgende geschlossene Form Annäherungen finden , aber ich habe nicht getestet , um zu sehen , ob sie die gleichen Ergebnisse geben ... Hayya et al, 1975 μ y : x = μ y / m u x + σ 2 x * μ y / μ 3 x + c o v ( x , y ) * σ 2 x * σσ 2 y : x

μ^y:x=μy/mux+σx2μy/μx3+cov(x,y)σx2σy2/μx2
σ^y:x2=σx2×μy/mux4+σy2/mux22cov(x,y)σx2σy2/mux3

Hayya, J. und Armstrong, D. und Gressis, N., 1975. Eine Anmerkung zum Verhältnis zweier normalverteilter Variablen. Management Science 21: 1338-1341


sollte ich die Update-Frage zur Berechnung der Varianz bei Zufallszügen aus dem Cauchy als separate Frage posten?
David LeBauer

μ=0

μ

XYZ=XYxyp(x,y)dxdy

Antworten:


6

Vielleicht möchten Sie sich einige der Referenzen im Wikipedia-Artikel zur Verhältnisverteilung ansehen . Möglicherweise finden Sie bessere Annäherungen oder Verteilungen. Ansonsten scheint Ihr Ansatz vernünftig.

Update Ich denke, eine bessere Referenz könnte sein:

Siehe Formeln 2-4 auf Seite 195.

Update 2

Zu Ihrer aktualisierten Frage bezüglich der Abweichung von einem Cauchy - wie John Cook in den Kommentaren hervorhob - gibt es keine Abweichung. Eine Stichprobenvarianz zu nehmen, funktioniert also einfach nicht als "Schätzer". In der Tat werden Sie feststellen, dass Ihre Stichprobenvarianz überhaupt nicht konvergiert und wild schwankt, wenn Sie weiter Stichproben nehmen.


Vielen Dank für die Referenz, in der ich die Referenz von Haaya 1975 und die Gleichungen in meiner Frage gefunden habe, obwohl ich die Bestätigung zu schätzen weiß, dass die Gleichungen für mein Problem geeignet sind.
David LeBauer

Bei einem kurzen Blick auf Haaya scheint es ihnen darum zu gehen, eine normale Annäherung für das Verhältnis zu erhalten, und sie verwenden Simulationen, um zu bestimmen, wann dies zutrifft (unter Verwendung des Variationskoeffizienten, cv). Entspricht der Lebenslauf in Ihrem Fall den Kriterien? In diesem Fall gelten die Annäherungswerte.
ars

1
@ David: benutze stattdessen Marsaglia 1965 wie in der Antwort aktualisiert.
ars

NB: Marsaglia veröffentlichte 2004 ein Update in JSS .
David LeBauer

XYZ=XYxyp(x,y)dxdy

0

y1N(.,.)

Mein unten stehender Vorschlag, den Cauchy zu verwenden, funktioniert nicht, wie in den Kommentaren von Ars und John ausgeführt.

Das Verhältnis zweier normalerweise zufälliger Variablen folgt der Cauchy- Verteilung. Sie können diese Idee verwenden, um die Parameter des Cauchy zu identifizieren, die Ihren Daten am ehesten entsprechen.


ein. Ich muss die Varianz schätzen und die Varianz der Cauchy-Verteilung ist nicht definiert.
David LeBauer

b. Wenn ich Ihren zweiten Punkt verstehe, könnte ich annehmen, dass y-1 ~ N (mu, sigma), aber ich muss immer noch mu und sigma aus der für y angegebenen zusammenfassenden Statistik berechnen. Außerdem habe ich beschlossen, Verteilungen mit Werten <0 für nur definierte Variablen> 0 nicht zu berücksichtigen (obwohl in vielen Fällen p (X <0 | X ~ N (mu, s)) -> 0)
David LeBauer

Gilt der Cauchy nicht für Normalen mit dem Mittelwert Null?
ars

@ars Du bist richtig. Der Cauchy kann dann von begrenztem Nutzen sein.

Ars: Ja, ich glaube, das Cauchy-Ergebnis erfordert null Mittel. Das bedeutet aber immer noch, dass zumindest in diesem speziellen Fall die Varianz, die David zu schätzen versucht, NICHT existiert.
John D. Cook
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.