Angenommen, wir haben ein Binärklassifizierungsproblem mit hauptsächlich kategorialen Merkmalen. Wir verwenden ein nichtlineares Modell (z. B. XGBoost oder Random Forests), um es zu lernen.
- Sollte man sich immer noch Sorgen um Multi-Kollinearität machen? Warum?
- Wenn die Antwort auf das oben Gesagte zutrifft, wie sollte man dagegen vorgehen, wenn man bedenkt, dass man diese Art von nichtlinearen Modellen verwendet?