Ich verwende die Support-Vektor-Regression, um einige ziemlich verzerrte Daten (mit hoher Kurtosis) zu modellieren. Ich habe versucht, die Daten direkt zu modellieren, aber ich erhalte falsche Vorhersagen, die meiner Meinung nach hauptsächlich auf die Verteilung der Daten zurückzuführen sind, die mit sehr fetten Schwänzen verzerrt ist. Ich bin mir ziemlich sicher, dass einige Ausreißer (die legitime Datenpunkte sind) das SVR-Training beeinflussen, und vielleicht auch die Kreuzvalidierung, bei der ich derzeit die Hyperparameter durch Minimierung des mittleren quadratischen Fehlers optimiere.
Ich habe versucht, meine Daten vor dem Anwenden von SVR zu skalieren (z. B. mithilfe einer sqrt-Funktion, um die Ausreißer zu reduzieren) sowie eine andere Funktion zur Minimierung von Hyperparametern (z. B. absoluter Fehler) zu verwenden, die bessere Ergebnisse zu liefern scheint, aber immer noch nicht sehr gut ist. Ich bin gespannt, ob jemand auf ähnliche Probleme gestoßen ist und wie er damit umgegangen ist. Vorschläge und / oder alternative Methoden sind herzlich willkommen.