Hier ist mein Code für die Feature-Auswahlmethode in Python:
from sklearn.svm import LinearSVC
from sklearn.datasets import load_iris
iris = load_iris()
X, y = iris.data, iris.target
X.shape
(150, 4)
X_new = LinearSVC(C=0.01, penalty="l1", dual=False).fit_transform(X, y)
X_new.shape
(150, 3)
Aber nachdem ich neues X (abhängige Variable - X_new) erhalten habe, woher weiß ich, welche Variablen entfernt werden und welche Variablen in dieser neuen aktualisierten Variablen berücksichtigt werden? (Welches wurde entfernt oder welche drei sind in den Daten vorhanden?)
Der Grund für diese Identifizierung besteht darin, auf neue Testdaten dieselbe Filterung anzuwenden.