Ich stimme @ ryan-zotti zu, dass eine harte Suche nicht unbedingt zu einer Überanpassung führt - oder zumindest nicht zu einem Betrag, den wir als Überanpassung bezeichnen würden. Lassen Sie mich versuchen, meinen Standpunkt dazu darzulegen:
Box hat einmal gesagt:
Denken Sie daran, dass alle Modelle falsch sind. Die praktische Frage ist, wie falsch sie sein müssen, um nicht nützlich zu sein.
(Perfekt zu sein würde alle Daten erfordern, was wiederum die Notwendigkeit eines Modells an erster Stelle eliminieren würde).
Modelle, die falsch sind, umfassen auch Über- und Unterausstattung1. Aber wir werden uns nicht unbedingt darum kümmern oder es überhaupt bemerken. Die Frage ist, wie viel von dem Modell, das von der Realität abweicht, a) überhaupt gemessen werden kann und b) akzeptabel ist, es nicht als über- oder unterpassend zu bezeichnen - da beide immer ein wenig auf jedes Modell zutreffen, das wir jemals bauen werden. Wenn unsere Modelle am Ende unsere Anforderungen erfüllen , sondern zB Über- / Unterbau nur minimal oder Über- / Unterbau auf Teile von (möglichen) Daten , die nicht in unserem Anwendungsfall betrachtet würden wir es akzeptieren - es ist nicht unbedingt zu verhindern , alle über - / underfitting.
Dies führt zu einer korrekten Konfiguration zum Messen / Erkennen von Modellfehlern, um zu entscheiden, ob dies das ist, was wir haben möchten. Was wir also tun können, ist, den Prozess so robust wie möglich zu gestalten, indem wir versuchen, Daten mit minimalem Rauschen und repräsentativen und ausreichenden Stichproben zu erhalten, so gut wie möglich zu modellieren, auszuwerten und auszuwählen und dies alles auf vernünftige Weise zu tun (z. B. wenige) Proben, viele Funktionen→weniger komplexes Modell; Wählen Sie das am wenigsten komplexe Modell mit noch akzeptabler Leistung usw.).
Denn: Am Ende werden wir immer Modellfehler / Über- / Unteranpassung haben - es ist die Fähigkeit, diesen Fehler in unserem Fokus des Interesses zu erkennen / zu messen , um vernünftige Entscheidungen zu treffen, die wichtig sind.
1a) Jedes Modell hat gleichzeitig ein Verzerrungs- und Varianzproblem (wir versuchen normalerweise, den richtigen Kompromiss zu finden, um unsere Bedürfnisse zu befriedigen). Modelle, die unsere Anforderungen erfüllen, werden notwendigerweise immer noch Vorurteile und Abweichungen aufweisen. b) Betrachten Sie verrauschte Daten und nicht repräsentative Stichproben als Gründe für eine Überanpassung. Jedes Modell modelliert notwendigerweise Rauschen sowie eine Beziehung, für die Teile der Information fehlen, so dass notwendigerweise falsche Annahmen getroffen werden.