Sollten wir kontinuierliche Variablen ablegen?


8

Ich weiß, dass dies bereits gefragt wurde, und ich habe die Antworten auf die früheren Fragen zum Binning kontinuierlicher Variablen gelesen. Ich verstehe, dass wir generell das Binning vermeiden sollten, da dies möglicherweise dazu führt, dass nützliche Informationen (unter anderem) weggeworfen werden. Ich versuche jedoch, ein logistisches Regressionsmodell zu erstellen, und einer meiner signifikanten Prädiktoren ist eine kontinuierliche Variable. Ich habe 2 verschiedene Modelle ausprobiert. Im ersten Fall habe ich die Variable so wie sie ist (kontinuierlich) eingegeben, während ich sie im zweiten Fall als kategoriale Variable (kategorisiert nach Quartilen) eingegeben habe.

Das zweite Modell (mit der gruppierten Variablen) hatte einen niedrigeren AIC-Wert und einen kreuzvalidierten Fehler. Könnte dies in diesem speziellen Fall als ausreichende Rechtfertigung für das Binning angesehen werden?


Gibt es eine externe Rechtfertigung für die Quartilteilung? In der Biostatistik kann es beispielsweise sehr wertvoll sein, einen Grenzwert bei einem klinisch relevanten Wert zu zeichnen, z. B. BMI <25 als Normalgewicht und BMI> = 25 als Übergewicht / Fettleibigkeit. Es fügt viel klinischen Nutzen hinzu (z. B. Beratung oder Risikobewertung), um an diesem Punkt zu teilen.
Ashe

Nicht wirklich! Abgesehen davon, dass wir viele unserer Daten nach Quartilen zusammenfassen und melden.
Dataminer

Antworten:


13

Dies bedeutet wahrscheinlich, dass Ihr Prädiktor eine nichtlineare Beziehung zur Antwort hat, und durch Binning kann das Modell einen Teil dieses nichtlinearen Trends erfassen. Wenn Sie sich ein Streudiagramm Ihrer Daten ansehen, können Sie feststellen, welche Anpassungsform geeignet ist. Möglicherweise möchten Sie eine nichtlineare kontinuierliche Anpassungsstrategie versuchen, z. B. Polynom- oder Spline-Basistransformationen.


1
Bitte. Sie sollten in der Lage sein, die Form der Beziehung mit einem Streudiagramm oder einem verwandten Bild zu sehen. Ich würde es auch sehr schätzen, wenn Sie die Antwort akzeptieren würden :)
Matthew Drury

Matthew - Ich denke, dieser Kommentar würde Ihre Antwort verbessern.
Glen_b -State Monica
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.