Datensatz sieht aus wie:
- 25000 Beobachtungen
- Bis zu 15 Prädiktoren verschiedener Typen: numerisch, kategorial für mehrere Klassen, binär
- Zielvariable ist binär
Welche Kreuzvalidierungsmethode ist typisch für diese Art von Problemen?
Standardmäßig verwende ich K-Fold. Wie viele Falten reichen in diesem Fall aus? (Eines der Modelle, die ich benutze, ist zufällige Gesamtstruktur, was zeitaufwändig ist ...)