Kaggle-Wettbewerbe bestimmen die endgültigen Platzierungen auf der Grundlage eines durchgehaltenen Testsatzes.
Ein durchgehaltener Testsatz ist eine Stichprobe; Es kann sein, dass es nicht repräsentativ für die zu modellierende Population ist. Da jede Einsendung wie eine Hypothese ist, hat der Algorithmus, der den Wettbewerb gewonnen hat, möglicherweise den Testsatz besser als die anderen getroffen. Mit anderen Worten, wenn ein anderer Testsatz ausgewählt und der Wettbewerb wiederholt würde, würden die Platzierungen gleich bleiben?
Für das Sponsoring-Unternehmen ist dies nicht wirklich wichtig (wahrscheinlich würden die Top-20-Einsendungen ihre Basislinie verbessern). Ironischerweise könnten sie jedoch ein Modell der ersten Reihe verwenden, das schlechter ist als die anderen Top 5. Für die Teilnehmer des Wettbewerbs scheint Kaggle letztendlich ein Glücksspiel zu sein - Glück ist nicht erforderlich, um über die richtige Lösung zu stolpern, es ist erforderlich, über die Lösung zu stolpern, die zum Test-Set passt!
Ist es möglich, den Wettbewerb so zu ändern, dass alle Spitzenteams, die statistisch nicht zu unterscheiden sind, gewinnen? Oder könnte in dieser Gruppe das sparsamste oder rechnerisch billigste Modell gewinnen?