Verwenden einer Reihe von binären logistischen Regressionen mit einer kategorialen Multiple-Choice-Antwortvariablen


8

Ich habe kategorische Umfragedaten zur Einstellung der Menschen zu einem bestimmten Politikbereich aus 13 Ländern. Die Antwortvariable ist kategorisch und enthält 4 verschiedene Antworten, die nicht geordnet werden können.

Ich möchte ein mehrstufiges Multinomialmodell mit zufälligem Schnittpunkt und zufälliger Steigung erstellen. Das Problem ist, dass die Anzahl der Fälle der Stufe 2 nur 13 beträgt und das Modell nicht konvergiert, zumindest nicht in seiner multinomialen Form.

Als zweitbeste Option denke ich darüber nach, die Antwortvariable in eine binäre Form umzucodieren, eine Reihe von mehrstufigen logistischen Regressionen auszuführen und dann vorhergesagte Wahrscheinlichkeiten zu verwenden, um zu zeigen, wie die Wahrscheinlichkeit abhängt, dass eine bestimmte interessierende Kategorie ausgewählt wird auf meine erklärenden Variablen. Dies ist anscheinend nur eine zweitbeste Option. Ich würde gerne wissen, welche Risiken mit diesem Ansatz verbunden sind und welche Einwände (von Gutachtern, Vorgesetzten usw.) ich erwarten sollte.


1
Unter welcher Software / welchem ​​Algorithmus konvergiert Ihr Modell nicht?
Wahrscheinlichkeitslogik

Antworten:


2

Die Wahl zwischen einem Multinomial und einer Reihe logistischer Regressionen ist in den meisten Fällen relativ künstlich. Da Sie in beiden Ansätzen eine Basiskategorie (Referenz) auswählen, für die die Quotenverhältnisse aller anderen Kategorien ausgedrückt werden, spielt es normalerweise keine Rolle, ob Sie die eine oder die andere haben, wenn die Referenzkategorie gleich bleibt. Der größte Nachteil besteht darin, dass Sie keine gleichzeitigen Parametereinschränkungen für alle Logistikmodelle testen können, was im multinomialen Fall recht einfach ist.

Trotzdem würde ich raten, keine zufälligen Effekte mit 13 Ländern (Level 2-Einheiten) zu verwenden, siehe z . B. https://www.statmodel.com/download/SRM2012.pdf .

Die Alternative besteht darin, ein Modell mit festen Effekten zu verwenden, bei dem Sie einen Dummy pro Land (minus 1) einschließen. Der größte Nachteil dieses Verfahrens besteht darin, dass das Testen von Effekten auf Makroebene nicht möglich ist. Wenn Sie diesbezüglich keine Hypothesen haben, würde ich mich für das Multinomialmodell mit festen Effekten entscheiden.


0

Ich würde Sie ermutigen, diese Analyse in einem Modell (in AMOS) durchzuführen, und ich denke nicht, dass Ihre Datenstruktur problematisch ist (siehe zum Beispiel: Maas, CJM & Hox, JJ (2005) Ausreichende Stichprobengrößen für die Mehrebenenmodellierung. Methodik, 1 86-92.). Wenn Sie mehrere Modelle mit demselben Datensatz ausführen, erhöhen Sie die Wahrscheinlichkeit, Fehler vom Typ I zu machen (mindestens müssen Sie die Bonferroni-Korrektur anwenden, die als konservative Technik angesehen wird).


1
Ihre Aussage, dass ein Zufallseffektmodell mit nur 13 übergeordneten Einheiten (in diesem Fall Ländern) unproblematisch ist, wird nicht von allen geteilt. Siehe zum Beispiel diese Simulationsstudie: iser.essex.ac.uk/publications/working-papers/iser/2013-14
Maarten Buis

Ich bin damit einverstanden, ich lese und höre, man sollte 20-30 Einheiten haben, siehe z. B. Hox et al.: Statmodel.com/download/SRM2012.pdf
tomka
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.