Logistische Regression mit binär abhängigen und unabhängigen Variablen

14

Ist es angebracht, eine logistische Regression durchzuführen, bei der sowohl die abhängigen als auch die unabhängigen Variablen binär sind? Zum Beispiel ist die abhängige Variable 0 und 1 und die Prädiktoren sind kontrastcodierte Variablen -1 und 1?

logistic

— hoch oben
quelle

6

Es gibt keinen Grund, dies nicht zu tun, aber zwei warnende Gedanken:

Behalten Sie den Überblick während der Analyse, welche welche ist. In großen Projekten kann es leicht passieren, dass Sie verloren gehen und fehlerhafte Ergebnisse erzielen.
Wenn Sie sich dafür entscheiden, Regressionsschätzungen anstelle von Quotenverhältnissen zu melden, machen Sie Ihr Codierungsschema in Ihrem Bericht klar , damit die Leser selbst keine ungenauen ORs erstellen , vorausgesetzt, sie wurden beide mit 0,1 codiert.

Mag grundlegend erscheinen, aber ich habe gesehen, dass beide Probleme es in veröffentlichte Veröffentlichungen geschafft haben.

— Fomite
quelle

Dann wäre es also auch angebracht, eine Datendatei in sechs Fälle zu unterteilen und einzelne Vergleiche in jedem Datensatz mit eingeschränkten codierten Prädiktoren durchzuführen.

— Oberhalb des

Ich bin mir ehrlich gesagt nicht sicher, wonach du fragst. Können Sie klarstellen, was Sie erreichen möchten?

— Fomite

Ich habe einen Datensatz mit 3 zwischen und 4 innerhalb der Subjektbedingungen. Ich würde gerne auf jeden einzelnen Effekt testen, aber eine einzelne Regression mit allen Interaktionen lässt eine Menge an Informationen aus, die mich interessieren. Stattdessen würde ich die Daten nach Bedingungen in separate Datensätze aufteilen und für jeden Datensatz eine gezielte logistische Regression mit Kontrast ausführen Codes für die Unterschiede, die mich interessieren.

— oben

Weitere Informationen darüber, wie ich die Kontrastcodes codiere, finden

— über dem

11

Klarheit: Der Begriff "binär" ist normalerweise nur für 1-gegen-0-Codierung reserviert. Allgemeineres Wort, das für eine 2-Wert-Codierung geeignet ist, ist "dichotom". Dichotome Prädiktoren sind natürlich zur logistischen Regression wie zur linearen Regression willkommen, und da sie nur zwei Werte haben, spielt es keine Rolle, ob sie als Faktoren oder als Kovariaten eingegeben werden.

— ttnphns
quelle

5

Normalerweise hilft es bei der Interpretation, wenn Sie Ihre Prädiktoren mit 0-1 codieren, aber abgesehen davon (und der Feststellung, dass dies nicht erforderlich ist) ist daran nichts auszusetzen. Es gibt einige andere (auf Kontingenztabellen basierende) Ansätze, aber wenn ich mich richtig erinnere, stellen sich diese als äquivalent zu (irgendeiner Form von) logistischer Regression heraus.

Kurz gesagt: Ich sehe keinen Grund, dies nicht zu tun.

— Nick Sabbe
quelle

Vielen Dank! Und wenn ich 3 kontrastcodierte Prädiktoren habe und sie alle 0-1 codiere, sind sie nicht orthogonal. Zum Beispiel habe ich 4 Kategorien und meine drei Codes sind L1: 1, -1,0,0 L2: 0,1, -1,0, L3: 0,0,1, -1. Ist das ein Problem?

— über dem

Ihre Beispiel-L-Matrix (L1, L2, L3) besteht aus den wiederholten Kontrasten, bei denen jede Kategorie mit der folgenden Kategorie verglichen wird. Diese Kontrastvorhersagen sind weder orthogonal noch binär (als 0-1 codiert). In der Tat sind ihre Werte 0,75 vs -.25 (1. Variable), 0,5 vs -.5 (2. Variable), 0,25 vs -.75 (3. Variable)

— ttnphns

3

Wenn Sie mehr als zwei Prädiktoren haben, ist es außerdem wahrscheinlicher, dass das Problem der Multi-Kollinearität auch bei logistischen oder multiplen Regressionen auftritt. Die Verwendung der logistischen Regression mit allen binären Variablen (dh codiert (0,1)) kann jedoch nicht schaden.

— Liebesstatistiken
quelle