Gibt es irgendwelche Papiere / Bücher / Ideen über die Beziehung zwischen der Anzahl der Merkmale und der Anzahl der Beobachtungen, die man benötigt, um einen "robusten" Klassifikator zu trainieren?
Angenommen, ich habe 1000 Features und 10 Beobachtungen aus zwei Klassen als Trainingssatz und 10 andere Beobachtungen als Testsatz. Ich trainiere einen Klassifikator X und er gibt mir 90% Sensitivität und 90% Spezifität auf dem Testset. Angenommen, ich bin mit dieser Genauigkeit zufrieden und kann daher sagen, dass es sich um einen guten Klassifikator handelt. Andererseits habe ich eine Funktion von 1000 Variablen mit nur 10 Punkten angenähert, was vielleicht nicht sehr ... robust zu sein scheint?