Bayesianische Analyse von Kontingenztabellen: Beschreibung der Effektgröße


9

Ich arbeite die Beispiele in Kruschkes Doing Bayesian Data Analysis durch , insbesondere die exponentielle Poisson-ANOVA in Kap. 22, die er als Alternative zu häufig auftretenden Chi-Quadrat-Unabhängigkeitstests für Kontingenztabellen vorstellt.

Ich kann sehen, wie wir Informationen über Interaktionen erhalten, die mehr oder weniger häufig auftreten als erwartet, wenn die Variablen unabhängig wären (dh wenn der HDI Null ausschließt).

Meine Frage ist, wie ich eine Effektgröße in diesem Framework berechnen oder interpretieren kann . Zum Beispiel schreibt Kruschke, "die Kombination von blauen Augen mit schwarzen Haaren kommt seltener vor, als es zu erwarten wäre, wenn Augenfarbe und Haarfarbe unabhängig wären", aber wie können wir die Stärke dieser Assoziation beschreiben? Wie kann ich feststellen, welche Interaktionen extremer sind als andere? Wenn wir einen Chi-Quadrat-Test dieser Daten durchführen würden, könnten wir das Cramér-V als Maß für die Gesamteffektgröße berechnen. Wie drücke ich die Effektgröße in diesem Bayes'schen Kontext aus?

Hier ist das in sich geschlossene Beispiel aus dem Buch (codiert in R), für den Fall, dass die Antwort mir in aller Deutlichkeit verborgen bleibt ...

df <- structure(c(20, 94, 84, 17, 68, 7, 119, 26, 5, 16, 29, 14, 15, 
10, 54, 14), .Dim = c(4L, 4L), .Dimnames = list(c("Black", "Blond", 
"Brunette", "Red"), c("Blue", "Brown", "Green", "Hazel")))

df

         Blue Brown Green Hazel
Black      20    68     5    15
Blond      94     7    16    10
Brunette   84   119    29    54
Red        17    26    14    14

Hier ist die häufigere Ausgabe mit Maß für die Effektgröße (nicht im Buch enthalten):

vcd::assocstats(df)
                    X^2 df P(> X^2)
Likelihood Ratio 146.44  9        0
Pearson          138.29  9        0

Phi-Coefficient   : 0.483 
Contingency Coeff.: 0.435 
Cramer's V        : 0.279

Hier ist die Bayes'sche Ausgabe mit HDIs und Zellwahrscheinlichkeiten (direkt aus dem Buch):

# prepare to get Krushkes' R codes from his web site
Krushkes_codes <- c(
  "http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/openGraphSaveGraph.R", 
  "http://www.indiana.edu/~kruschke/DoingBayesianDataAnalysis/Programs/PoissonExponentialJagsSTZ.R")

# download Krushkes' scripts to working directory
lapply(Krushkes_codes, function(i) download.file(i, destfile = basename(i)))

# run the code to analyse the data and generate output
lapply(Krushkes_codes, function(i) source(basename(i)))

Und hier sind Diagramme des hinteren Exponentialmodells von Poisson, die auf die Daten angewendet wurden:

Geben Sie hier die Bildbeschreibung ein

Und Diagramme der posterioren Verteilung auf geschätzte Zellwahrscheinlichkeiten:

Geben Sie hier die Bildbeschreibung ein

Antworten:


1

Laut Index erwähnt Kruschke die Effektgröße nur zweimal, und beide Male stehen sie im Kontext einer metrischen vorhergesagten Variablen. Aber da ist dieses Stück auf S. 601:

βrc

β1,2Sβ1,2x1,2yiPois(λi)λi=eβ1,2x1,2+S=eβ1,2x1,2eSx1,2λieβ1,2


1

Eine Möglichkeit, die Effektgröße im ANOVA-Modell zu untersuchen, besteht darin, die Standardabweichungen "Superpopulation" und "Endliche Population" zu betrachten. Sie haben eine Zwei-Wege-Tabelle, dies sind also 3 Varianzkomponenten (2 Haupteffekte und 1 Interaktion). Dies basiert auf einer mcmc-Analyse. Sie berechnen die Standardabweichung für jeden Effekt für jede mcmc-Probe.

sk=1dk1j=1dk(βk,jβ¯k)2

kskk

Andrew Gelman befürwortete diesen Ansatz. Siehe seine Arbeit von 2005 "Varianzanalyse: Warum ist sie wichtiger denn je?"


Das Papier ist hier erhältlich .
Sean Easter

Beide Antworten scheinen sehr vielversprechend zu sein, danke. Ist einer von Ihnen vertraut genug, um Rzu zeigen, wie es programmiert werden könnte?
Ben

@ Seaneaster - danke, dass du den Link hinzugefügt hast. @ben, diese Berechnungen sind in R einfach. Ich bin mir jedoch nicht sicher, in welcher Form Ihre Beispiele vorliegen. Sie sollten sie in sd ()Kombination mit einer der "Apply" -Funktionen verwenden können. Boxplots sind einfach zu handhaben boxplot ().
Wahrscheinlichkeitslogik

Danke, können Sie anhand der Beispieldaten und des Codes in meiner Frage demonstrieren?
Ben

Kurz gesagt, nein, weil ich den von Ihnen geposteten Code nicht verstehe - ich kann nicht sehen, wie die Daten organisiert sind. Und wie gesagt, dies ist keine schwierige Analyse. Dieser Ansatz berechnet ein einfaches Maß (Standardabweichung). Darüber hinaus ist die R-Codierung nicht Teil Ihrer Frage. Sie haben gefragt, wie die Kontingenztabellenanalyse zusammengefasst werden soll.
Wahrscheinlichkeitslogik
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.