Ich finde es oft so, dass ich mit caret
R mehrere verschiedene Vorhersagemodelle trainiere. Ich trainiere sie alle auf den gleichen Kreuzvalidierungsfalten mit caret::: createFolds
und wähle dann das beste Modell basierend auf kreuzvalidierten Fehlern.
Die Medianvorhersage mehrerer Modelle übertrifft jedoch häufig das beste Einzelmodell in einem unabhängigen Testsatz. Ich denke darüber nach, einige Funktionen zum Stapeln / Zusammensetzen von Caret-Modellen zu schreiben, die mit den gleichen Kreuzvalidierungsfalten trainiert wurden, zum Beispiel indem Medianvorhersagen von jedem Modell auf jeder Falte genommen werden oder indem ein "Metamodell" trainiert wird.
Dies kann natürlich eine äußere Kreuzvalidierungsschleife erfordern. Kennt jemand irgendwelche existierenden Pakete / Open-Source-Code zum Zusammenstellen von Caret-Modellen (und möglicherweise zum Kreuzvalidieren dieser Ensembles)?