Nur zur Verdeutlichung - ich glaube, ich bin der jüngste Antragsteller.
Spezifischer Kommentar zu Mikes Punkten:
Es ist klar, dass der I / II / III-Unterschied nur für korrelierte Prädiktoren gilt (von denen unausgeglichene Konstruktionen das häufigste Beispiel sind, sicherlich in der faktoriellen ANOVA) - aber dies scheint mir ein Argument zu sein, das die Analyse der unausgeglichenen Situation zunichte macht (und damit jede Debatte vom Typ I / II / III). Es mag unvollkommen sein, aber so geschehen die Dinge (und in vielen Zusammenhängen überwiegen die Kosten für die weitere Datenerfassung trotz aller Einschränkungen das statistische Problem).
Dies ist völlig fair und repräsentiert das Fleisch der meisten Argumente für "II versus III", denen ich begegnet bin. Die beste Zusammenfassung, auf die ich gestoßen bin, ist Langsrud (2003) "ANOVA für unausgeglichene Daten: Verwenden Sie Typ II anstelle von Typ III-Quadratsummen", Statistics and Computing 13: 163-167 (Ich habe ein PDF, wenn das Original schwer zu finden ist ). Er argumentiert (am Beispiel des Zweifaktor-Falls), dass es bei einer Wechselwirkung eine Wechselwirkung gibt, sodass die Berücksichtigung von Haupteffekten normalerweise bedeutungslos ist (ein offensichtlich fairer Punkt) - und wenn es keine Wechselwirkung gibt, die Typ-II-Analyse von Die Haupteffekte sind (zweifellos) leistungsstärker als beim Typ III, daher sollten Sie sich immer für Typ II entscheiden. Ich habe andere Argumente gesehen (zB Venables,
Und ich stimme dem zu: Wenn Sie eine Interaktion haben, aber auch eine Frage zum Haupteffekt haben, dann sind Sie wahrscheinlich auf dem Gebiet der Heimwerker.
Es ist klar, dass es diejenigen gibt, die nur Typ III wollen, weil SPSS dies tut, oder einen anderen Verweis auf die statistische Höhere Behörde. Ich bin nicht ganz gegen diese Ansicht, wenn es darauf ankommt, dass eine Menge Leute an SPSS festhalten (gegen die ich einige Dinge habe, nämlich Zeit, Geld und Lizenzablaufbedingungen) und Typ III SS oder eine Menge Leute, die zu R und Typ III SS wechseln. Allerdings ist dieses Argument statistisch eindeutig lahm.
Das Argument, das ich für Typ III als wesentlich aussagekräftiger empfand, stammt jedoch von Myers & Well (2003, "Research Design and Statistical Analysis", S. 323, 626-629) und Maxwell & Delaney (2004, " Experimente entwerfen und Daten analysieren: Eine Modellvergleichsperspektive ", S. 324-328, 332-335). Das ist wie folgt:
- Wenn es eine Interaktion gibt, geben alle Methoden dasselbe Ergebnis für die Interaktionssumme der Quadrate
- Typ II geht davon aus, dass es keine Wechselwirkung für den Test der Haupteffekte gibt. Typ III nicht
- Einige (z. B. Langsrud) argumentieren, dass Sie, wenn die Wechselwirkung nicht signifikant ist, zu Recht davon ausgehen, dass es keine gibt, und die (stärkeren) Haupteffekte des Typs II betrachten
- Wenn der Test der Wechselwirkung jedoch nicht ausreichend ist und dennoch eine Wechselwirkung vorliegt, kann die Wechselwirkung "nicht signifikant" ausfallen und dennoch zu einem Verstoß gegen die Annahmen des Hauptwirkungstests Typ II führen, wodurch diese Tests als zu liberal eingestuft werden .
- Myers & Well zitieren Appelbaum / Cramer als die wichtigsten Befürworter des Typ-II-Ansatzes und fahren fort [S. 323]: "... Es könnten konservativere Kriterien für die Nicht-Signifikanz der Wechselwirkung verwendet werden, zum Beispiel die Forderung, dass die Wechselwirkung bei nicht signifikant ist Die Konsequenzen dieses Ansatzes sind jedoch nur unzureichend bekannt. In der Regel sollten die Quadratsummen des Typs II nur berechnet werden, wenn ein zwingender Grund vorliegt, von vornherein keine Wechselwirkungseffekte und eine eindeutig nicht signifikante Wechselwirkung anzunehmen Quadratsumme." Sie zitieren [S. 629] Lee & Hornick 1981 als einen Beweis dafür, dass Wechselwirkungen, die sich keiner Signifikanz nähern, Tests der Haupteffekte beeinflussen können. Maxwell & Delaney [p334] befürworten den Typ-II-Ansatz, wenn die Populationswechselwirkung null ist, für Macht, und der Typ-III-Ansatz, wenn dies nicht der Fall ist [für die Interpretierbarkeit von aus diesem Ansatz abgeleiteten Mitteln]. Auch sie befürworten die Verwendung von Typ III in der realen Situation (wenn Sie Rückschlüsse auf das Vorhandensein der Interaktion aus den Daten ziehen), da das Problem besteht, dass im Interaktionstest ein Fehler vom Typ 2 [unterfordert] und damit versehentlich verletzt wird die Annahmen des SS-Ansatzes Typ II; sie machen dann ähnliche weitere Punkte zu Myers & Well und nehmen die lange Debatte zu diesem Thema zur Kenntnis! Rückschlüsse auf das Vorhandensein der Interaktion aus den Daten ziehen), da beim Interaktionstest ein Fehler vom Typ 2 [unterfordert] aufgetreten ist und damit versehentlich die Annahmen des SS-Ansatzes vom Typ II verletzt wurden; sie machen dann ähnliche weitere Punkte zu Myers & Well und nehmen die lange Debatte zu diesem Thema zur Kenntnis! Rückschlüsse auf das Vorhandensein der Interaktion aus den Daten ziehen), da beim Interaktionstest ein Fehler vom Typ 2 [unterfordert] aufgetreten ist und damit versehentlich die Annahmen des SS-Ansatzes vom Typ II verletzt wurden; sie machen dann ähnliche weitere Punkte zu Myers & Well und nehmen die lange Debatte zu diesem Thema zur Kenntnis!
Meine Interpretation (und ich bin kein Experte!) Ist, dass es auf beiden Seiten des Arguments eine Menge höherer statistischer Stellen gibt. Die üblichen Argumente beziehen sich nicht auf die übliche Situation, die zu Problemen führen würde (diese Situation ist die häufigste bei der Interpretation von Haupteffekten mit einer nicht signifikanten Wechselwirkung). und dass es in dieser Situation gute Gründe gibt, über den Typ-II-Ansatz besorgt zu sein (und es kommt auf eine Sache an, bei der Macht gegen potentiellen Überliberalismus ankommt).
Für mich ist das genug, um mir sowohl die Option Typ III in ezANOVA als auch Typ II zu wünschen, da dies (für mein Geld) eine hervorragende Schnittstelle zu den ANOVA-Systemen von R ist. R ist meiner Ansicht nach nicht einfach für Anfänger zu verwenden, und das "ez" -Paket mit ezANOVA und den hübschen Effekt-Plot-Funktionen trägt wesentlich dazu bei, R einem allgemeineren Forschungspublikum zugänglich zu machen. Einige meiner Gedanken (und ein böser Hack für ezANOVA) sind unter http://www.psychol.cam.ac.uk/statistics/R/anova.html zu finden .
Würde mich interessieren, alle Gedanken zu hören!