Bereitstellung einer Stichprobengröße "N", die ich zur Vorhersage von Daten verwenden möchte. Wie kann ich die Daten so unterteilen, dass ich einige davon zum Erstellen eines Modells und die restlichen Daten zum Validieren des Modells verwende?
Ich weiß, dass es keine Schwarz-Weiß-Antwort darauf gibt, aber es wäre interessant, einige "Faustregeln" oder normalerweise verwendete Verhältnisse zu kennen. Ich weiß, dass einer unserer Professoren an der Universität bei 60% Modell sagte und bei 40% validierte.