Ich habe ValueError erhalten, als ich Testdaten mit einem RandomForest-Modell vorhersagte.
Mein Code:
clf = RandomForestClassifier(n_estimators=10, max_depth=6, n_jobs=1, verbose=2)
clf.fit(X_fit, y_fit)
df_test.fillna(df_test.mean())
X_test = df_test.values
y_pred = clf.predict(X_test)
Der Fehler:
ValueError: Input contains NaN, infinity or a value too large for dtype('float32').
Wie finde ich die schlechten Werte im Testdatensatz? Ich möchte diese Datensätze auch nicht löschen. Kann ich sie einfach durch den Mittelwert oder den Median ersetzen?
Vielen Dank.