Kontext: SysID und Kontrollperson, die in ML eingestiegen ist.
Ich denke, dass die Antwort von user110686 einige Unterschiede recht gut erklärt. Bei SysID geht es zwangsläufig um dynamische Modelle aus Eingabe- / Ausgabedaten, während ML eine größere Klasse von Problemen abdeckt. Aber der größte Unterschied, den ich sehe, hängt mit (a) Speicher (Anzahl der Parameter) zusammen; (b) Endanwendung des "erlernten" Modells. Die Systemidentifikation ist in hohem Maße ein Signalverarbeitungsansatz, der Frequenzdomänendarstellungen, Zeit-Frequenz-Analysen usw. berücksichtigt. Einige ML-Leute nennen dies "Feature Engineering".
(eine Erinnerung:SysID wurde bekannt, lange bevor ML als Forschungsgebiet Gestalt annahm. Daher waren Statistiken und Signalverarbeitung die Hauptgrundlage für die theoretischen Grundlagen, und die Berechnung war schwierig. Daher arbeiteten die Leute mit sehr einfachen Modellklassen (Bias-Varianz-Kompromiss) mit sehr wenigen Parametern. Wir sprechen von höchstens 30-40 Parametern und meist linearen Modellen, selbst wenn die Leute klar wissen, dass das Problem nicht linear ist. Allerdings ist die Berechnung jetzt sehr billig, aber SysID ist noch nicht aus seiner Hülle herausgekommen. Die Leute sollten sich darüber im Klaren sein, dass wir jetzt viel bessere Sensoren haben und mit sehr umfangreichen Modellsätzen problemlos Tausende von Parametern abschätzen können. Einige Forscher haben versucht, neuronale Netze für SysID zu verwenden, aber viele scheinen diese nicht als "Mainstream" zu akzeptieren, da es nicht viele theoretische Garantien gibt.
(b) Endanwendung des erlernten Modells: Nun ist eine Sache, dass SysID sehr korrekt ist, aber viele ML-Algorithmen nicht erfassen können. Es ist wichtig zu wissen, dass Sie für die Zielanwendungen unbedingt Modelle erstellen, die effektiv für die Online-Optimierung verwendet werden können.Diese Modelle werden verwendet, um alle getroffenen Steuerungsentscheidungen zu verbreiten, und wenn dies als optimales Steuerungsproblem eingerichtet wird, werden die Modelle zu Einschränkungen. Wenn Sie also eine extrem komplizierte Modellstruktur verwenden, wird die Online-Optimierung erheblich erschwert. Beachten Sie auch, dass diese Online-Entscheidungen in Sekunden oder weniger getroffen werden. Als Alternative wird vorgeschlagen, die Wertefunktion für eine optimale Steuerung außerhalb der Richtlinien direkt zu lernen. Dies ist im Grunde genommen ein verstärkendes Lernen, und ich denke, es gibt gute Synergien zwischen SysID und RL.