Ich habe in letzter Zeit versucht, mehr über Online-Lernen zu lernen (es ist absolut faszinierend!), Und ein Thema, das ich nicht richtig verstehen konnte, ist, wie man über Modellauswahl in Offline- oder Online-Kontexten nachdenkt. Insbesondere nehmen wir trainieren ein Klassifikator offline, basierend auf einer festen Datensatz D . Wir schätzen seine Leistungsmerkmale beispielsweise durch Kreuzvalidierung und wählen auf diese Weise den besten Klassifikator aus.
Ich habe darüber nachgedacht: Wie gehen wir dann vor, um auf eine Online-Umgebung anzuwenden ? Können wir davon ausgehen, dass das beste offline gefundene S auch als Online-Klassifikator gut funktioniert? Ist es sinnvoll, einige Daten zu sammeln, um S zu trainieren , dann denselben Klassifikator S zu nehmen und ihn in einer Online-Einstellung mit denselben Parametern wie in D zu "operationalisieren" , oder könnte ein anderer Ansatz besser sein? Was sind die Vorbehalte in diesen Fällen? Was sind hier die wichtigsten Ergebnisse? Und so weiter.
Wie auch immer, jetzt da draußen, ich denke, was ich suche, sind einige Referenzen oder Ressourcen, die mir (und hoffentlich anderen, die über diese Art von Dingen nachgedacht haben!) Helfen, den Übergang vom Denken nur in Offline-Begriffen zu schaffen, und Entwickeln Sie den mentalen Rahmen, um im Verlauf meiner Lektüre kohärenter über das Thema Modellauswahl und diese Fragen nachzudenken.