Der folgende Auszug ist aus Schwagers Hedge Fund Market Wizzards (Mai 2012), einem Interview mit dem durchweg erfolgreichen Hedge Fund Manager Jaffray Woodriff:
Auf die Frage: "Was sind die schlimmsten Fehler, die Menschen beim Data Mining machen?":
Viele Leute denken, dass sie in Ordnung sind, weil sie In-Sample-Daten zum Training und Out-of-Sample-Daten zum Testen verwenden. Anschließend sortieren sie die Modelle basierend auf der Leistung der Stichprobendaten und wählen die besten Modelle aus, um die Daten außerhalb der Stichprobe zu testen. Die menschliche Tendenz besteht darin, die Modelle zu verwenden, die in den Out-of-Sample-Daten weiterhin gute Ergebnisse erzielen, und diese Modelle für den Handel auszuwählen. Bei dieser Art von Prozess werden die Daten außerhalb der Stichprobe einfach in einen Teil der Trainingsdaten umgewandelt, da die Modelle ausgewählt werden, die im Zeitraum außerhalb der Stichprobe am besten abschnitten. Dies ist einer der häufigsten Fehler, die Menschen machen, und einer der Gründe, warum Data Mining, wie es normalerweise angewendet wird, schreckliche Ergebnisse liefert.
Der Interviewer fragt dann: "Was solltest du stattdessen tun?":
Sie können nach Mustern suchen, bei denen im Durchschnitt alle Modelle außerhalb der Stichprobe weiterhin gute Ergebnisse erzielen. Sie wissen, dass es Ihnen gut geht, wenn der Durchschnitt der Modelle außerhalb der Stichprobe einen signifikanten Prozentsatz der Punktzahl innerhalb der Stichprobe ausmacht. Im Allgemeinen sind Sie wirklich auf dem richtigen Weg, wenn die Ergebnisse außerhalb der Stichprobe mehr als 50 Prozent der Ergebnisse innerhalb der Stichprobe ausmachen. Das Geschäftsmodell von QIM hätte niemals funktioniert, wenn SAS und IBM großartige Prognosemodellierungssoftware entwickelt hätten.
Meine Fragen
Ergibt das irgendeinen Sinn? Was meint er? Haben Sie eine Ahnung - oder vielleicht sogar einen Namen für die vorgeschlagene Methode und einige Referenzen? Oder hat dieser Kerl den heiligen Gral gefunden, den sonst niemand versteht? Er sagt sogar in diesem Interview, dass seine Methode die Wissenschaft möglicherweise revolutionieren könnte ...