Vorsicht vor Überanpassung . Ein genaueres Modell der von einem System gesammelten Daten ist möglicherweise kein besserer Prädiktor für das zukünftige Verhalten eines Systems.
Das obige Bild zeigt zwei Modelle einiger Daten.
Die lineare Linie ist in Bezug auf die Trainingsdaten (die Punkte in der Grafik) ziemlich genau, und (wie zu erwarten) ist sie in Bezug auf die Testdaten (wo die Punkte wahrscheinlich für x <5 und x> -5 sind) ziemlich genau ).
Im Gegensatz dazu ist das Polynom für die Trainingsdaten zu 100% genau, aber (es sei denn, Sie haben Grund zu der Annahme, dass das Polynom 9. Grades aus physikalischen Gründen sinnvoll ist), würden Sie davon ausgehen, dass dies ein äußerst schlechter Prädiktor für x> 5 und ist x <-5.
Das lineare Modell ist 'weniger genau', basierend auf einem Vergleich von Fehlern mit den von uns gesammelten Daten. Aber es ist allgemeiner.
Darüber hinaus müssen sich die Ingenieure weniger Gedanken über ihr Modell machen und mehr darüber, was die Leute mit dem Modell machen werden.
Wenn ich dir sage, dass wir an einem heißen Tag spazieren gehen und es voraussichtlich 426 Minuten dauern wird. Sie werden wahrscheinlich weniger Wasser mitbringen, als wenn ich Ihnen sage, dass die Wanderung 7 Stunden dauern wird, und noch weniger, als wenn ich sage, dass die Wanderung 4 bis 8 Stunden dauern wird. Dies liegt daran, dass Sie eher auf mein implizites Vertrauen in meine Prognose als auf den Mittelpunkt meiner angegebenen Zeiten reagieren.
Wenn Sie Leuten ein genaues Modell geben, verringern die Leute ihre Fehlerquote. Dies führt zu größeren Risiken.
Nehmen Sie den Spaziergang an einem heißen Tag, wenn ich weiß, dass der Spaziergang in 95% der Fälle 4-8 Stunden dauern wird, mit einigen Unsicherheiten in Bezug auf Navigation und Schrittgeschwindigkeit. Wenn Sie unsere Schrittgeschwindigkeit genau kennen, wird die Unsicherheit der 4: 8-Zahl verringert, aber die Wahrscheinlichkeit, dass wir so lange brauchen, dass Wasser zum Problem wird, wird dadurch nicht wesentlich beeinträchtigt, da dies fast ausschließlich von der unsicheren Navigation abhängt die unsichere Gehgeschwindigkeit.