Eine kritische Unterscheidung ist, ob Sie:
- [Häufigster Fall]: Erstellen Sie eine Schätzung der Leistung für neue Themen (aus derselben Population wie Ihre Daten).
- Erstellen Sie eine Leistungsschätzung für neue Beobachtungen von denselben Probanden wie in Ihrer Stichprobe.
Der weitaus häufigere Fall ist die Fallnummer (1). Wie gut prognostizieren Sie beispielsweise einen Herzinfarkt für jemanden, der in die Notaufnahme kommt? Und wenn Sie in Fall (1) sind, Sie ziemlicher Sicherheit (a) eine themenbezogene Kreuzvalidierung und nicht (b) eine rekordbezogene Kreuzvalidierung durchführen. Eine rekordverdächtige Validierung in Fall (1) führt wahrscheinlich zu unangemessen hohen, falschen Schätzungen der Leistung bei neuen Probanden.
Ich verstehe nicht genau, was Sie versuchen zu tun (und vielleicht ist es Selbststudium, daher ist die Frage nicht ganz realistisch). Ich weiß nicht, in welchem Fall Sie sich befinden. Wenn Sie sich in einem viel selteneren Fall befinden (2), ist die Validierung von Aufzeichnungen möglicherweise in Ordnung.
Ein allgemeines Thema in der Statistik ist es, sorgfältig darüber nachzudenken, was unabhängig ist und was korreliert. Im Allgemeinen ist eine unabhängige Beobachtung ein anderes Thema. Wenn Sie die Leistung vorhersagen möchten neuen Fächern , müssen Sie bei Fächern testen, auf denen Sie nicht trainiert haben!
Warum eher eine themenbezogene Kreuzvalidierung als eine rekordbezogene?
In typischen Umgebungen werden wiederholte Beobachtungen desselben Individuums auch nach Konditionierung von Merkmalen miteinander korreliert. Daher ist Ihr Test-Set bei der rekordverdächtigen Kreuzvalidierung nicht unabhängig von Ihrem Trainingsset! Im Extremfall perfekter Korrelation hätten Sie genau die gleichen Beobachtungen im Trainingssatz und im Testsatz! Sie würden am Testset trainieren! Die bei der Kreuzvalidierung gemessene Leistung würde die Leistung bei neuen Probanden nicht vorhersagen.
In diesem kürzlich erschienenen Artikel wird beispielsweise die rekordübergreifende Kreuzvalidierung "Voodoo Machine Learning" genannt.
Was tun mit so wenigen Themen?
k = n
Um die Daten für das Training zu maximieren, können Sie ein Thema für die Kreuzvalidierung weglassen. Testen Sie bei jeder Iteration ein anderes Thema und trainieren Sie alle anderen.
n = 38 und möchten möglicherweise so viele unabhängige Fächer in das Trainingsset aufnehmen.