Wie verschmilzt ein Ensemble-Klassifikator die Vorhersagen seiner konstituierenden Klassifikatoren? Ich habe Schwierigkeiten, eine klare Beschreibung zu finden. In einigen Codebeispielen, die ich gefunden habe, mittelt das Ensemble nur die Vorhersagen, aber ich sehe nicht, wie dies zu einer "besseren" Gesamtgenauigkeit führen könnte.
Betrachten Sie den folgenden Fall. Ein Ensemble-Klassifikator besteht aus 10 Klassifikatoren. Ein Klassifikator hat eine Genauigkeit von 100% der Zeit in der Datenuntermenge X und 0% aller anderen Zeiten. Alle anderen Klassifizierer haben eine Genauigkeit von 0% in der Datenuntermenge X und 100% in allen anderen Zeiten.
Bei Verwendung einer Mittelungsformel, bei der die Genauigkeit des Klassifikators ignoriert wird, hätte der Ensemble-Klassifikator bestenfalls eine Genauigkeit von 50%. Ist das richtig oder fehlt mir etwas? Wie kann die durchschnittliche Vorhersage von N potenziell ahnungslosen Klassifikatoren möglicherweise zu einer besseren Vorhersage führen als ein einzelner Klassifikator, der ein Experte in einem bestimmten Bereich ist?