Führt dies nicht zu einer Überanpassung? Wären meine Ergebnisse zuverlässiger, wenn ich als Teil der Analyse ein Klappmesser oder ein Bootstrap-Verfahren hinzufügen würde?
Führt dies nicht zu einer Überanpassung? Wären meine Ergebnisse zuverlässiger, wenn ich als Teil der Analyse ein Klappmesser oder ein Bootstrap-Verfahren hinzufügen würde?
Antworten:
Ich denke, ein Modell zu bauen und es zu testen, sind verschiedene Dinge. Die Rückwärtseliminierung ist Teil des Modellbaus. Jack Messer und Bootstrap werden eher verwendet, um es zu testen.
Mit Bootstrap und Klappmesser können Sie sicherlich zuverlässigere Schätzungen haben als mit der einfachen Rückwärtseliminierung. Aber wenn Sie wirklich die Überanpassung testen möchten, ist der ultimative Test eine geteilte Stichprobe, trainieren Sie einige, testen Sie andere. Auslassen ist für diesen Zweck zu instabil / unzuverlässig: http://www.russpoldrack.org/2012/12/the-perils-of-leave-one-out.html
Ich denke, mindestens 10% der Probanden müssen draußen sein, um stabilere Schätzungen der Robustheit des Modells zu erhalten. Und wenn Sie 20 Fächer haben, sind 2 Fächer immer noch sehr wenige. Dann stellt sich jedoch die Frage, ob Sie eine ausreichend große Stichprobe haben, um ein Modell zu erstellen, das auf den Rest der Bevölkerung angewendet werden kann.
Hoffe, es hat Ihre Frage zumindest teilweise beantwortet.