Was sind aus technischer Sicht die Nachteile eines zu genauen Modells?


24

Ich habe mich aus technischer Sicht gefragt, aus welchen Gründen eine zu genaue Modellierung nachteilig sein kann.

Aus wissenschaftlicher Sicht scheint es fast immer ein Vorteil zu sein, abgesehen davon, wann Sie weniger Rechenzeit benötigen.

Warum sollten Sie aus technischer Sicht neben Zeit (oder Rechenleistung) das vermeiden?


2
Bitte definieren Sie hier "Genauigkeit" und "zu viel". Sie könnten ein Modell haben, das den Unsicherheitsbereich mit extrem hoher Genauigkeit vorhersagt, oder ein Modell, das die Unsicherheit selbst auf einen sehr kleinen Wert reduziert. Und so weiter.
Carl Witthoft

1
„Alles sollte so einfach wie möglich gemacht werden, aber nicht einfacher.“ Einstein.
Eric Duminil

1
"neben der Zeit (oder Rechenleistung)" Es scheint, dass alle Antworten diesen Punkt verpasst haben ..
Agentp

1
@agentp Im Gegenteil, die Frage beantwortet sich von selbst, indem sie versucht, dies auszuschließen. Es ist eine dumme Sache, überhaupt in Frage zu kommen.
jpmc26

2
Dies ist im Ernst die schlimmste Frage, die ich je gesehen habe. Es ist absolut verwirrend.
Agentp

Antworten:


38

Vorsicht vor Überanpassung . Ein genaueres Modell der von einem System gesammelten Daten ist möglicherweise kein besserer Prädiktor für das zukünftige Verhalten eines Systems.

Überanpassungsbeispiel

Das obige Bild zeigt zwei Modelle einiger Daten.

Die lineare Linie ist in Bezug auf die Trainingsdaten (die Punkte in der Grafik) ziemlich genau, und (wie zu erwarten) ist sie in Bezug auf die Testdaten (wo die Punkte wahrscheinlich für x <5 und x> -5 sind) ziemlich genau ).

Im Gegensatz dazu ist das Polynom für die Trainingsdaten zu 100% genau, aber (es sei denn, Sie haben Grund zu der Annahme, dass das Polynom 9. Grades aus physikalischen Gründen sinnvoll ist), würden Sie davon ausgehen, dass dies ein äußerst schlechter Prädiktor für x> 5 und ist x <-5.

Das lineare Modell ist 'weniger genau', basierend auf einem Vergleich von Fehlern mit den von uns gesammelten Daten. Aber es ist allgemeiner.

Darüber hinaus müssen sich die Ingenieure weniger Gedanken über ihr Modell machen und mehr darüber, was die Leute mit dem Modell machen werden.

Wenn ich dir sage, dass wir an einem heißen Tag spazieren gehen und es voraussichtlich 426 Minuten dauern wird. Sie werden wahrscheinlich weniger Wasser mitbringen, als wenn ich Ihnen sage, dass die Wanderung 7 Stunden dauern wird, und noch weniger, als wenn ich sage, dass die Wanderung 4 bis 8 Stunden dauern wird. Dies liegt daran, dass Sie eher auf mein implizites Vertrauen in meine Prognose als auf den Mittelpunkt meiner angegebenen Zeiten reagieren.

Wenn Sie Leuten ein genaues Modell geben, verringern die Leute ihre Fehlerquote. Dies führt zu größeren Risiken.

Nehmen Sie den Spaziergang an einem heißen Tag, wenn ich weiß, dass der Spaziergang in 95% der Fälle 4-8 Stunden dauern wird, mit einigen Unsicherheiten in Bezug auf Navigation und Schrittgeschwindigkeit. Wenn Sie unsere Schrittgeschwindigkeit genau kennen, wird die Unsicherheit der 4: 8-Zahl verringert, aber die Wahrscheinlichkeit, dass wir so lange brauchen, dass Wasser zum Problem wird, wird dadurch nicht wesentlich beeinträchtigt, da dies fast ausschließlich von der unsicheren Navigation abhängt die unsichere Gehgeschwindigkeit.


1
Richtig, obwohl ich bemerken würde, dass ein Polynom des Grades ein Beispiel mit ungewöhnlich schlechtem Verhalten ist; ein solches modell sollte man auf keinen fall verwenden. Sinnvolle Modelle sollten auch bei Überausstattung nicht so explodieren, es sei denn, Sie verlassen tatsächlich den durch die Messungen abgedeckten Bereich . In der Tat würde sogar ein Polynom vom Grad 8 angesichts dieser Daten bereits zu einer viel glatteren Anpassung führen. N
links

Hauptzitat aus dem verlinkten Wikipedia-Artikel: "Überanpassung tritt auf, wenn ein Modell beginnt, Trainingsdaten zu" merken ", anstatt zu" lernen ", aus einem Trend zu verallgemeinern."
Emilio M Bumachar

4
Würden wir Überanpassung wirklich als "zu viel Genauigkeit im Modell" betrachten? Das ist kein Nachteil, wenn man ein "zu genaues Modell" hat. Das ist ein Nachteil, wenn man zu viele genaue Punkte hat und schlecht modelliert . Aus genauen Daten ein schlechtes Modell zu machen, ist kein genaues Modell.
JMac

@JMac: Eine Überanpassung kann natürlich im Kontext des maschinellen Lernens auftreten, ohne absichtlich ein schlechtes Modell zu erstellen, indem einfach zu viele Daten auf den Trainingssatz geworfen werden. Ich bin nicht sicher, ob "zu genau" der richtige Weg ist, um diese Art von Ergebnis zu beschreiben, aber es ist auch kein "einfacher Modellierungsfehler".
Kevin

26

Der offensichtlichste Nachteil sind die Kosten, alle Ingenieurprojekte haben ein begrenztes Budget und es ist eindeutig eine schlechte Sache, mehr Geld auszugeben als nötig, ganz zu schweigen von Zeitverschwendung.

Es kann auch subtilere Probleme geben. Bei Dingen wie der FE-Analyse handelt es sich immer um Näherungswerte, und manchmal kann das Hinzufügen unnötiger Details zu Artefakten führen und die Fehlersuche bei einem Modell erschweren. Beispielsweise können Diskontinuitäten auftreten, die zu Stresserhöhungen führen

Es gibt auch die Überlegung, dass selbst wenn Sie über die Rechenleistung verfügen, um einen großen Teil der Datenlieferanten und -kunden bequem zu handhaben, das Übertragen großer Dateien möglicherweise nicht und in vielen Fällen immer noch ein gewisser Engpass ist.

Wenn Sie über mehr Parameter verfügen, als Sie benötigen, müssen Sie möglicherweise zusätzliche Arbeit für die Verwaltung und das Debuggen von Dateien leisten.

Auch wenn Sie jetzt über reichlich Zeit und Ressourcen verfügen, kann es gut sein, dass jemand in der Zukunft dieses Modell ohne den gleichen Luxus verwenden muss, insbesondere, wenn es Teil eines Produkts ist, das Sie an Kunden verkaufen.


7
Abfrage: 2. Absatz sollte es lesen „... Zugabe notwendig Detail ...“ oder ‚Hinzufügen un notwendig Detail‘
Fred

Ja, sollte unnötig sein
Chris Johns

Ich bin mir nicht sicher, ob das FE-Beispiel hier gut funktioniert. In diesem Fall wird die FE ist das Modell. Die Verwendung genauerer Daten kann zu Problemen führen. Wenn Ihr FE- Modell jedoch genau ist, müssen Sie sich offensichtlich keine Sorgen um die Artefakte machen. weil Ihr Modell sie nicht hat. Wir haben es bereits als genau definiert . Vielleicht im Fall der Verwendung eines anderen Modells, um eine FE-Analyse durchzuführen; Aber dann ist das meist nur der Punkt, an dem das Modell von "jemandem weiter unten" verwendet wird.
JMac

13

Dafür gibt es einige Gründe.

Aus einer rein pragmatischen Perspektive ist dies auf zeitliche Einschränkungen zurückzuführen. Die erforderliche Zeit zum Lösen eines Modells nimmt zu sehr viel schneller als der Genauigkeitsgrad, und welcher Wert auch immer gewählt wird, ist jedenfalls subjektiv.

±515% . Warum sollten Sie sich also mit einem sehr genauen Modell beschäftigen, wenn einer Ihrer Tasteneingänge um 10% abweichen kann? (Es versteht sich von selbst, dass die Fehlergrenzen für andere Materialien wie Beton oder Boden und für andere Variablen wie Belastung erheblich höher sind).

Aus diesem Grund macht es keinen Sinn, zu genau zu sein. Aber in der Tat kann es vorteilhaft sein, nicht einmal zu genau zu sein. Die Gründe dafür sind jedoch meist psychologischer Natur. Hauptsächlich möchten Sie nicht, dass Ihr Modell zu genau ist, und Sie möchten Ihre Ergebnisse nicht mit sieben Dezimalstellen ausgeben, weil Sie kein falsches Gefühl von Vertrauen hervorrufen möchten.

Das menschliche Gehirn ist fest davon überzeugt, dass 1.2393532697 ein genauerer Wert als 1.2 ist. Das ist aber eigentlich nicht der Fall. Aufgrund all der Unsicherheiten in der Praxis, die Ihr Modell möglicherweise nicht berücksichtigen kann (insbesondere angesichts der aktuellen Hardware-Einschränkungen), ist 1.2 mit ziemlicher Sicherheit genauso gültig wie 1.2393532697. Machen Sie sich also nicht selbst oder dem, der Ihr Modell sieht, etwas vor. Geben Sie einfach 1.2 aus, was transparent anzeigt, dass Sie nach dieser zweiten Ziffer nicht wirklich wissen, was los ist.


6

Für ein äußerst genaues Modell ist möglicherweise eine unzulässige Menge an Eingabedaten erforderlich. Es könnte möglich sein, ein hervorragendes Modell von Wettersystemen zu erstellen, indem beispielsweise die Position und Geschwindigkeit jedes Gasmoleküls in der Atmosphäre als Eingabe verwendet wird. In der Praxis wäre ein solches Modell nicht sinnvoll, da es keine realistische Möglichkeit gibt, die richtigen Eingaben zu generieren. In diesem Fall wäre ein weniger genaues Modell vorzuziehen, das nur begrenzte Eingabedaten erfordert.


1
Sie haben eine andere Frage beantwortet, nämlich: "Wie viele Eingabedaten sind zu viel
?

Ich würde hier wahrscheinlich einen Hinweis hinzufügen, wie in der Frage erwähnt wird, "außerdem, wenn Sie weniger Rechenzeit benötigen", da dies auch ein guter Grund ist, ein weniger genaues Modell zu haben. Wenn Ihr Modell zu genau ist, dauert die Berechnung realer Fälle möglicherweise länger als der Hitzetod des Universums.
Delioth

5

"Zu genau" ist nicht monoton. Es kann tatsächlich eine Illusion der Wiedergabetreue erzeugen, die Sie glauben macht, es lohnt sich, mehr Geld in die Simulation zu pumpen. Dies ist sehr wichtig, wenn Sie Daten aus Modellen mit gemischter Wiedergabetreue präsentieren, bei denen einige Teile sehr detailliert und andere Teile sehr grob sind.

Ein Beispiel aus der Praxis, bei dem ich Höhen über dem Gelände abgetastet hatte. Das Team hatte beschlossen, das Gelände in 1024 Stücken abzutasten, um die Wiedergabetreue zu maximieren. Unser Kunde wollte eine ReallyGood ™ Antwort.

Jetzt störten mich die Laufzeit-Hits, die dieser spezielle Algorithmus verursachte, und ich wollte verstehen, für wie viel Wiedergabetreue ich tatsächlich bezahlte. Ich hatte keine Geländedaten gesehen und fragte sie, wie sie sie geladen hätten. Die Antwort war "Oh, wir haben kein Gelände. Es ist nur flach."

Es hörte sich so an, als hätte ich ein fantastisches High-Fidelity-Modell, das 1024 Punkte gesammelt hat. Was ich tatsächlich hatte, war ein Low-Fidelity-Modell, das nicht besser war als 1 Punkt 1024-mal abzutasten, sondern eine ganze Tonne langsamer lief und sich als High-Fidelity-Modell tarnte!

In der realen Ingenieurwelt haben Führungskräfte nicht immer die Möglichkeit, die gesamte Architektur eines Modells zu erlernen. Tatsächlich würde ich sagen, dass sie nie die Zeit haben. Unsere Führung traf Entscheidungen unter der Annahme, dass wir ein hervorragendes 1024-Punkte-Modell hatten. Niemand war schuld, es ist nur das, was passiert, wenn Sie die Wiedergabetreue an einem Teil des Modells zu hoch und an dem anderen Teil zu niedrig einstellen. Es ist die Natur des Tieres mit gemischter Treue.


Bei einer Parabel darüber, wie auf signifikante Zahlen reduziert wird, geht es nicht immer nur darum, nachstehende Nullen abzuschneiden.
Eikre

1

In Wirklichkeit gibt es die Daten, die wir haben, und es gibt die Daten, die wir nicht haben. Fast immer ist die Datenmenge, über die wir nicht verfügen, viel größer, als wir es aus praktischen oder wirtschaftlichen Gründen erhoffen könnten.

Wenn wir versuchen, die Daten widerwärtig gut auf die wenigen verfügbaren Stichproben abzustimmen, besteht die Gefahr, dass unser Modell wirklich schlechte Schätzungen in Bereichen vornimmt, in denen wir ehrlich gesagt keine Ahnung haben (aufgrund von Datenmangel). Dann gibt uns unser Modell ein falsches Sicherheitsgefühl.


1

Warum sollten Sie aus technischer Sicht das vermeiden, abgesehen von Zeit (oder Rechenleistung)?

Aus Sicht des Maschinenbaus liegt der Hauptgrund darin, dass Sie sich nur dann für den zusätzlichen Aufwand einsetzen, wenn sich die Ergebnisse erheblich unterscheiden.

Wenn der Genauigkeitsgrad in Ihrem Modell um Größenordnungen höher ist als der Genauigkeitsgrad, den Sie bei der Ausführung Ihres Entwurfs liefern können, verschwenden Sie Ihren Aufwand. Wenn der in Ihrem Modell beschriebene Genauigkeitsgrad höher ist als erforderlich, hat dies Auswirkungen auf den Kunden. Du verschwendest Geld. Wenn Sie z. B. eine höhere Präzision angeben, als die Konstruktion tatsächlich erfordert (z. B. +/- 0,00001 mm in der Länge eines Entlüftungsrohrs), verschwenden Sie Geld für Ihre Kunden, da eine Entlüftungsöffnung von 350 mm in die Atmosphäre ungefähr die gleiche Arbeit leistet wie eine Entlüftungsöffnung von 350.0005 mm zu Atmosphäre, aber letztere ist deutlich teurer in der Herstellung.

An der Universität haben wir alle gelernt, die physikalische Welt mithilfe der Newtonschen Physik zu modellieren, obwohl es allgemein bekannt ist, dass die post-Newtonsche Physik ein genaueres Modell des physikalischen Verhaltens darstellt. Trotzdem kenne ich kein Maschinenbauprogramm, das Newtonsche Modelle standardmäßig als zu ungenau ansieht. Wenn wir das genauere Modell verwenden und eine Antwort finden, die 0,1% näher an der theoretischen Wahrheit liegt, hat dies in den allermeisten Fällen keinen Einfluss auf unser endgültiges Design. Wenn unsere Streckgrenze um 0,1% abweicht, ergibt sich ein unwesentlicher Unterschied im erforderlichen Querschnitt, der uns dazu veranlasst, nach beiden Methoden genau die gleiche Größe des I-Strahls zu wählen. In diesem Fall bringen die Mehrkosten keinen zusätzlichen Nutzen.

Nun gibt es Situationen, in denen Präzision erforderlich ist, um ein funktionsfähiges Design zu erstellen, beispielsweise die Modellierung einiger Satelliten, die relativistische Physik erfordern. Unter diesen Umständen müssen wir ein Modell finden, das die erforderliche Genauigkeit liefert, und wir müssen das Modell entwerfen. Wenn wir die Abmessungen auf +/- 0,0001% berechnen müssen, ist es völlig umständlich, wenn unsere Teileabmessungen +/- 0,1% betragen. In realen Anwendungen sind Teileabmessungen mit dem letztgenannten Genauigkeitsgrad viel häufiger als die erstgenannten.


0

Kosten: Die Kosten für Zeit oder die Kosten für Rechenleistung und die Kosten für Genauigkeit - wenn andere Variablen eine Toleranz von 5% haben, zum Beispiel, warum Ergebnisse mit 1% berechnet werden ...


0

In den vorherigen Antworten wurden Eingabe und Kosten erwähnt. Wenn Sie Genauigkeit wollen, z. Bei der Optimierung von Produktionsparametern sind wahrscheinlich mehr Messungen erforderlich. Zunächst müssen Sie analysieren, inwieweit Sie die Kosten im Vergleich zu der Anzahl der Arbeitsstunden senken können. Dies führt zu einer Erhöhung der Messfrequenz oder der Kosten für ein automatisiertes System, das die manuelle Datenerfassung ersetzt. Zweites Beispiel: Wenn Sie sehr genaue Ergebnisse erhalten, in die Sie Zeit und andere Ressourcen investiert haben, um diese zu erhalten, verfügen Sie über angemessene Ausrüstung für Qualitätskontrolle, industrielle Messungen usw. oder sogar Technologie. Wenn Ihre Ergebnisse vergeblich sind, ist die Zeit, die Sie dafür aufgewendet haben, falsch.


0

Benötigen Sie ein Satellitenbild mit Zentimeterauflösung, um Wälder anhand ihrer Farbe zu identifizieren? Sicher nicht. Ich wäre nachteilig, da Sie sich für einen nicht-grünen 10-Quadratzentimeter-Fleck entscheiden müssten. Dasselbe gilt für die Modellierung: Die Detailauflösung sollte zur Auflösung Ihrer Zielobjekte passen. Wenn nicht, verlieren Sie Zeit beim Downsizing.


0

Die meisten realen Antworten werden durch Ihre künstliche Einschränkung ausgeschlossen, dass Rechenleistung und Rechenzeiten nicht berücksichtigt werden. Ein Modell, dessen Auswertung Stunden oder Tage in Anspruch nimmt, ermöglicht keine schnellen Entwurfsiterationen und verlangsamt die Arbeit auf menschlicher Ebene, erhöht die Kosten und führt möglicherweise zu minderwertigen Ergebnissen. Das clevere Vereinfachen von Modellen ohne zu viel Genauigkeit kann ein sehr nützlicher Ansatz sein. Dann kann das Brute-Force-Modell verwendet werden, um die endgültige Iteration zu validieren.

Es ist möglich, dass übermäßig komplexe Modelle fundamentale Fehler im Modell maskieren oder dass die Arbeit, die erforderlich ist, um Informationen zu sammeln, um das Modell praktisch maximal zu nutzen, den potenziellen Nutzen überwiegt. Wenn Sie beispielsweise die Eigenschaften eines Materials genauer kennen müssen, als der Lieferant sie steuern kann, können Sie entweder die Fehlerbereiche akzeptieren oder jede Materialcharge testen, um das Modell zu optimieren.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.