Wie andere angemerkt haben, kann dies linear mit einer Interaktion modelliert werden. Sie interagieren mit zwei Dummies, und daran ist nichts Nichtlineares. In Anbetracht des Modells:
Der marginale Effekt 'gender' ist die partielle Ableitung:
wt=α+b1age+b2gender+b3age∗gender+ϵ
∂wt∂gender=b2+b3age
Sehen Sie, wie wir, wenn Geschlecht und Alter nur Werte von 0 oder 1 annehmen können, im Wesentlichen nur einen Mittelwertunterschied für vier verschiedene Gruppen betrachten? Das heißt, wir haben nur die vier verschiedenen Kombinationen, die wir in die obigen Gleichungen einfügen können: (1) und , (2) und , (3) und und (4) und . Ihr spezifisches Beispiel entspricht also einem Vergleich zwischen vier Gruppenmitteln.gender=0age=0gender=1age=1gender=0age=1gender=1age=0
Es kann auch hilfreich sein, diese Diskussion zu sehen, um zu verstehen, wie das oben Gesagte ANOVA mit zwei interagierten nominalen Variablen entspricht. Als weitere Möglichkeit, die Tatsache zu wiederholen, dass wir mit Ihrem spezifischen Beispiel (auch hier gibt es nur vier mögliche Kombinationen von Alter und Geschlecht) auch ein Modell wie das folgende ohne expliziten Interaktionsbegriff angeben könnten:
wt=α+b1young.male+b2old.male+b3young.female+ϵ
Wenn als Referenzkategorie weggelassen wird und beispielsweise der Koeffizient ein zwischen und . Wo der Schnitt wird auch durchschnittliche gleich innerhalb (wiederum die Referenzkategorie).old.femaleb1old.femaleyoung.maleαwtold.female
Probieren Sie es mit Ihren eigenen Daten aus. Mit einem linearen Modell mit einer Interaktion, einer ANOVA mit einer Interaktion oder der Verwendung von Dummies für jede der Gruppen ohne Interaktion erhalten Sie dieselben Ergebnisse. Ziemlich cool, oder? Ein Statistikbuch könnte jede dieser Methoden in einem anderen Kapitel aber alle Wege führen nach Rom. Zu sehen, wie dies mit Ihren eigenen Daten funktioniert, ist eine der besten Möglichkeiten, dies zu lernen. …
Die obigen Beispiele sind daher ein zu komplizierter Weg, um zu dieser Schlussfolgerung zu gelangen (dass wir wirklich nur vier Gruppenmittelwerte vergleichen), aber um zu lernen, wie Interaktionen funktionieren, halte ich dies für eine hilfreiche Übung. Es gibt andere sehr gute Beiträge im Lebenslauf über die Interaktion einer kontinuierlichen Variablen mit einer nominalen Variablen oder die Interaktion zweier kontinuierlicher Variablen. Obwohl Ihre Frage bearbeitet wurde, um nichtparametrische Tests zu spezifizieren, halte ich es für hilfreich, Ihr Problem anhand eines konventionelleren (dh parametrischen) Ansatzes zu betrachten, da die meisten nichtparametrischen Ansätze für Hypothesentests dieselbe Logik haben, aber im Allgemeinen mit weniger Annahmen über bestimmte Verteilungen.
Die Frage stellte sich jedoch speziell nach einem nichtparametrischen Ansatz, der beispielsweise angemessener sein könnte, wenn wir bestimmte Annahmen über die Normalität von nicht treffen wollten . Ein geeigneter nichtparametrischer Test wäre Dunns Test . Dieser Test ähnelt dem Wilcoxon-Mann-Whitney-Rang-Summen-Test, weist jedoch mehr als zwei Kategorien auf.wt
Andere Permutationstests können ebenfalls geeignet sein, wenn Sie einen bestimmten Unterschied in den Mitteln hatten, mit denen Sie beispielsweise gegen . Unabhängig davon, ob Sie R verwenden oder nicht, bietet die Dokumentation des Münzpakets eine gute Zusammenfassung verschiedener nichtparametrischer Tests und unter welchen Umständen diese Tests angemessen sein könnten. old.menyoung.women
Kurz neben "signifikanten" Interaktionen
Manchmal sehen Sie Aussagen wie "Die Interaktion zwischen und war statistisch signifikant." Solche Aussagen sind nicht unbedingt falsch, aber irreführend. Wenn ein Autor dies schreibt, sagt er normalerweise, dass der Koeffizient für den Interaktionsterm statistisch signifikant war. Dies ist jedoch ein bedingungsloser Effekt in einem bedingten Modell. Ein genauerer Bericht würde sagen, dass " über 'einige Werte' von statistisch signifikant war", wobei alle anderen Kovariaten auf einem vernünftigen Wert wie einem Mittelwert, Median oder Modus konstant gehalten wurden.x1x2x1x2Wenn wir jedoch nur zwei Kovariaten haben, die nur Werte von 0 oder 1 annehmen können, bedeutet dies, dass wir im Wesentlichen vier Gruppenmittelwerte betrachten.
Gearbeitetes Beispiel
Vergleichen wir die Ergebnisse des Interaktionsmodells mit den Ergebnissen des Dunn-Tests. Lassen Sie uns zunächst einige Daten generieren, bei denen (a) Männer mehr wiegen als Frauen, (b) jüngere Männer weniger wiegen als ältere Männer und (c) es keinen Unterschied zwischen jüngeren und älteren Frauen gibt.
set.seed(405)
old.men<-rnorm(50,mean=80,sd=15)
young.men<-rnorm(50,mean=70,sd=15)
young.women<-rnorm(50,mean=60,sd=15)
old.women<-rnorm(50,mean=60,sd=15)
cat<-rep(1:4, c(50,50,50,50))
gender<-rep(1:2, c(100,100))
age<-c(rep(1,50),rep(2,100),rep(1,50))
wt<-c(old.men,young.men,young.women,old.women)
data<-data.frame(cbind(wt,cat,age,gender))
data$cat<-factor(data$cat,labels=c("old.men","young.men","young.women","old.women"))
data$age<-factor(data$age,labels=c("old","young"))
data$gender<-factor(data$gender,labels=c("male","female"))
Schätzen Sie das Interaktionsmodell und erhalten Sie das vorhergesagte aus dem Randeffekt (Paket mit den Effekten). Sehen Sie hier , warum wir wollen nicht die bedingungslosen Effekte in einem Modell wie folgt zu interpretieren. Stattdessen wollen wir marginale Effekte interpretieren. Das Modell erkennt die Unterschiede, die wir bei der Generierung unserer Beispieldaten auferlegt haben, anständig.wt
mod<-lm(wt~age*gender,data)
library(effects)
allEffects(mod)
model: wt ~ age * gender
age*gender effect
gender
age male female
old 80.61897 57.70635
young 67.78351 56.01228
Müssen Sie einen Standardfehler oder ein Konfidenzintervall für Ihren Randeffekt berechnen? Das oben erwähnte "Effekt" -Paket kann dies für Sie tun, aber noch besser, Aiken und West (1991) geben Ihnen die Formeln, selbst für viel kompliziertere Interaktionsmodelle. Ihre Tabellen sind bequem gedruckt hier , zusammen mit sehr guten Kommentar von Matt Golder.
Nun, um Dunns Test zu implementieren.
#install.packages("dunn.test")
dunn.test(data$wt, data$cat, method="bh")
Kruskal-Wallis chi-squared = 65.9549, df = 3, p-value = 0
Comparison of x by group
(Benjamini-Hochberg)
Col Mean-|
Row Mean | old.men young.me young.wo
---------+---------------------------------
young.me | 3.662802
| 0.0002*
|
young.wo | 7.185657 3.522855
| 0.0000* 0.0003*
|
old.wome | 6.705346 3.042544 -0.480310
| 0.0000* 0.0014* 0.3155
Der p-Wert des Kruskal-Wallis-Chi-Quadrat-Testergebnisses legt nahe, dass mindestens eine unserer Gruppen "aus einer anderen Population stammt". Bei den gruppenweisen Vergleichen ist die obere Zahl Dunns Z-Test-Statistik und die untere Zahl ein p-Wert, der für mehrere Vergleiche angepasst wurde. Da unsere Beispieldaten eher künstlich waren, ist es nicht überraschend, dass wir so viele kleine p-Werte haben. Beachten Sie jedoch den Vergleich unten rechts zwischen jüngeren und älteren Frauen. Der Test unterstützt korrekt die Nullhypothese, dass zwischen diesen beiden Gruppen kein Unterschied besteht.
Sowohl das Interaktionsmodell als auch Dunns Test führen uns zu ähnlichen Schlussfolgerungen. In allen oben angegebenen Beispielen vergleichen wir irgendwie die Gruppenmittelwerte. Und obwohl es sicherlich engere Ansätze zum Vergleichen von Gruppenmitteln gibt, habe ich versucht zu veranschaulichen, wie das Vergleichen von Gruppenmitteln auch als Interaktion oder "2D-Effekt" mit einigen Modellspezifikationen, insbesondere mit nominalen Interaktionen, verstanden werden kann. Ich denke, dass das Verständnis dafür hilfreich ist, um kompliziertere Modelle mit Interaktionseffekten zu verstehen. Ich bin zu Link geht dieser artice einmal mehr, nur weil ich denke , es sollte das Lesen für mit Interaktionen arbeiten jedermann verlangt werden (es gibt einen Grund , dieser Artikel hat über 3k mal zitiert worden ).…
UPDATE: Angesichts anderer Antworten wurde diese Antwort aktualisiert, um die Idee zu bestreiten, dass dies irgendeine Form nichtlinearer Modellierung erfordert oder dass - angesichts des spezifischen Beispiels von OP für zwei binäre Kovariaten, dh vier Gruppen - eine vorhanden sein muss Vorzeichenwechsel, um dies nicht parametrisch zu beurteilen. Wenn das Alter beispielsweise kontinuierlich wäre, gäbe es andere Möglichkeiten, um dieses Problem anzugehen, aber dies war nicht das Beispiel von OP.