Ich habe ein Klassifizierungsproblem ( Klasse) mit etwa 100 reellen Prädiktoren, von denen einer viel mehr Erklärungskraft zu haben scheint als jeder andere. Ich möchte näher auf die Auswirkungen der anderen Variablen eingehen. Standardtechniken des maschinellen Lernens (zufällige Wälder, SVMs usw.) scheinen jedoch von dem einen starken Prädiktor überflutet zu werden und geben mir nicht viele interessante Informationen über die anderen.
Wenn dies ein Regressionsproblem wäre, würde ich mich einfach gegen den starken Prädiktor zurückbilden und dann die Residuen als Eingaben für andere Algorithmen verwenden. Ich sehe jedoch nicht wirklich, wie dieser Ansatz in einen Klassifizierungskontext übersetzt werden kann.
Mein Instinkt ist, dass dieses Problem einigermaßen häufig sein muss: Gibt es eine Standardtechnik, um damit umzugehen?