Bei der Arbeit mit vielen Eingabevariablen geht es uns häufig um Multikollinearität . Es gibt eine Reihe von Maßstäben für Multikollinearität, mit denen Multikollinearität erkannt, überlegt und / oder kommuniziert wird. Einige allgemeine Empfehlungen sind:
- Das Mehrfache für eine bestimmte Variable
- Die Toleranz für eine bestimmte Variable
- Der Varianzinflationsfaktor für eine bestimmte Variable
Die Bedingungsnummer der Entwurfsmatrix als Ganzes:
(Es gibt einige andere Optionen, die im Wikipedia-Artikel und hier auf SO im Kontext von R diskutiert werden .)
Die Tatsache, dass die ersten drei eine perfekte Funktion voneinander sind, legt nahe, dass der einzig mögliche Nettovorteil zwischen ihnen psychologischer Natur wäre. Andererseits können Sie mit den ersten drei Variablen einzeln untersuchen, was möglicherweise von Vorteil ist, aber ich habe gehört, dass die Bedingungsnummernmethode als die beste angesehen wird.
- Ist das wahr? Am besten für was?
- Ist die Bedingungsnummer eine perfekte Funktion der 's? (Ich würde denken, dass es sein würde.)
- Finden die Leute, dass einer von ihnen am einfachsten zu erklären ist? (Ich habe nie versucht, diese Zahlen außerhalb des Unterrichts zu erklären. Ich gebe nur eine lose, qualitative Beschreibung der Multikollinearität.)