Meine Frage: Soll ich auch für einen relativ großen Datensatz einen Lebenslauf machen?
Ich habe einen relativ großen Datensatz und werde einen Algorithmus für maschinelles Lernen auf den Datensatz anwenden.
Da mein PC nicht schnell ist, dauert der Lebenslauf (und die Rastersuche) manchmal zu lange. Insbesondere endet eine SVM nie aufgrund vieler Abstimmungsparameter. Wenn ich also einen Lebenslauf mache, muss ich relativ kleine Daten auswählen.
Andererseits sollte der Validierungssatz auch groß sein, daher halte ich es für eine gute Idee, einen Validierungssatz zu verwenden, der dieselbe (oder eine größere) Größe wie der Trainingssatz hat. (Anstelle von CV verwende ich nämlich einen großen Validierungssatz für die Parametereinstellung.)
Ich habe jetzt also mindestens zwei Möglichkeiten.
- Führen Sie einen Lebenslauf für einen kleinen Datensatz durch.
- Verwenden Sie einen relativ großen Trainingssatz und einen Validierungssatz ohne Lebenslauf.
- andere Idee.
Was ist die beste Idee? Theoretische oder praktische Meinungen sind willkommen.