"Dummy-Variable" und "Indikatorvariable" sind häufig verwendete Bezeichnungen zur Beschreibung der Zugehörigkeit zu einer Kategorie mit 0/1 Kodierung. in der Regel 0: kein Mitglied der Kategorie, 1: Mitglied der Kategorie.
Am 26.11.2014 ergab eine schnelle Suche auf scholar.google.com (mit Anführungszeichen), dass in ungefähr 318.000 Artikeln "Dummy-Variable" und in ungefähr 112.000 Artikeln "Indikator-Variable" verwendet wird. Der Begriff "Scheinvariable" hat in der nichtstatistischen Mathematik auch eine Bedeutung für " gebundene Variable ", was wahrscheinlich zur stärkeren Verwendung von "Scheinvariable" in indizierten Artikeln beiträgt.
Meine aktuell verknüpften Fragen:
- Sind diese Begriffe auch immer (innerhalb der Statistik)?
- Wird einer dieser Begriffe jemals in akzeptabler Weise auf andere Formen der kategorialen Codierung angewendet (z. B. Effektcodierung , Helmert-Codierung usw. )?
- Welche statistischen oder disziplinarischen Gründe sprechen dafür, einen Begriff dem anderen vorzuziehen?
sex
.
male
, wobei 1 wahr (in diesem Fall männlich) und 0 falsch (in diesem Fall weiblich) bedeutet. Wenn ich den Variablennamen verwende, muss sex
ich jedes Mal nachsehen, wie ich diese Variable codiert habe, wenn ich zu diesem Datensatz zurückkehre.
male
mit Werten1
oder codiert sein0
. Wenn es eine kategoriale Variable mit mehr als 2 Kategorien gibt, die dann zu Indikatorvariablen für die Zugehörigkeit in jeder Ebene erweitert wird, würde ich "Dummy-Variablen" verwenden, um diesen Satz von Indikatorvariablen zu beschreiben.