Ich habe ein konzeptionelles Problem mit dem Verständnis, wie eine schrittweise logistische Regression validiert werden kann. Jedes Mal, wenn der Trainingssatz geteilt wird, ist es sehr wahrscheinlich, dass unterschiedliche Merkmale basierend auf den Kriterien für Penter und Premove ausgewählt werden. Sollte ich jedes Mal eine Kreuzvalidierung mit einem anderen gewählten Modell durchführen oder sollte ich eine Grundwahrheit finden und mit der Kreuzvalidierung fortfahren? Ich denke, letzteres klingt vernünftiger, aber ich befürchte, dass ich irgendwo die Testblindheit gefährde. Hilfe wird geschätzt.