Welche der folgenden Schritte ist beim Erstellen eines Vorhersagemodells die richtige?
Option 1:
Beseitigen Sie zuerst die offensichtlich schlechtesten Prädiktoren und verarbeiten Sie die verbleibenden bei Bedarf vor, trainieren Sie dann verschiedene Modelle mit Kreuzvalidierung, wählen Sie die wenigen besten aus, identifizieren Sie die jeweils verwendeten Top-Prädiktoren, trainieren Sie diese Modelle dann nur mit diesen Prädiktoren neu und bewerten Sie die Genauigkeit erneut mit Kreuzvalidierung, dann wählen Sie die beste aus und trainieren Sie sie mit ihren wichtigsten Prädiktoren auf dem gesamten Trainingssatz und verwenden Sie sie dann, um den Testsatz vorherzusagen.
Option 2:
Beseitigen Sie zuerst die offensichtlich schlechtesten Prädiktoren, verarbeiten Sie dann die verbleibenden bei Bedarf vor und verwenden Sie dann eine Merkmalsauswahltechnik wie die rekursive Merkmalsauswahl (z. B. RFE mit HF) mit Kreuzvalidierung, um beispielsweise die ideale Anzahl von Schlüsselprädiktoren und deren Prädiktoren zu identifizieren trainieren Sie dann verschiedene Modelltypen mit Kreuzvalidierung und sehen Sie, welcher mit den zuvor identifizierten Top-Prädiktoren die beste Genauigkeit bietet. Trainieren Sie dann das beste dieser Modelle erneut mit diesen Prädiktoren auf dem gesamten Trainingssatz und verwenden Sie es dann, um den Testsatz vorherzusagen.