Ich stieß auf eine einfache Frage zum Vergleich flexibler Modelle (dh Splines) mit unflexiblen Modellen (z. B. lineare Regression) unter verschiedenen Szenarien. Die Frage ist:
Erwarten wir im Allgemeinen, dass die Leistung einer flexiblen statistischen Lernmethode besser oder schlechter abschneidet als eine unflexible Methode, wenn:
- Die Anzahl der Prädiktoren ist extrem groß und die Anzahl der Beobachtungen ist klein?
- Die Varianz der Fehlerterme, dh , ist extrem hoch?
Ich denke für (1), wenn klein ist, sind unflexible Modelle besser (nicht sicher). Für (2) weiß ich nicht, welches Modell (relativ) besser ist.