Ich bin ziemlich neu in zufälligen Wäldern. In der Vergangenheit habe ich immer die Genauigkeit von Fit vs. Test mit Fit vs. Zug verglichen , um eine Überanpassung festzustellen. Aber ich habe gerade hier gelesen , dass:
"In zufälligen Gesamtstrukturen ist keine Kreuzvalidierung oder ein separater Testsatz erforderlich, um eine unvoreingenommene Schätzung des Testsatzfehlers zu erhalten. Sie wird intern während des Laufs geschätzt ..."
Der kleine Absatz oben befindet sich im Abschnitt " OOB-Fehlerschätzung" . Dieses Out-of-Bag-Fehlerkonzept ist für mich völlig neu und etwas verwirrend: Der OOB-Fehler in meinem Modell beträgt 35% (oder 65% Genauigkeit). Wenn ich meine Daten jedoch einer Quervalidierung unterziehe, handelt es sich lediglich um einen einfachen Fehler Verfahren) und beide vergleichen fit vs Test gegen fit vs Zug I jeweils eine 65% ige Genauigkeit und eine 96% ige Genauigkeit erhalten. Nach meiner Erfahrung wird dies als Überanpassung angesehen, aber das OOB weist einen Fehler von 35% auf, genau wie mein Fit vs. Test- Fehler. Überanpassung Sollte ich überhaupt Kreuzvalidierung verwenden, um in zufälligen Wäldern auf Überanpassung zu prüfen?
Kurz gesagt, ich bin nicht sicher , ob ich die OOB vertrauen sollte unvoreingenommen Fehler des Prüfgerätes Fehler zu erhalten , wenn mein fit vs Zug zeigt an, dass ich Überanpassung!