Problem
Bei der Regression berechnet man normalerweise den mittleren quadratischen Fehler (MSE) für eine Stichprobe: , um die Qualität eines Prädiktors zu messen.
Im Moment arbeite ich an einem Regressionsproblem, bei dem das Ziel darin besteht, den Preis vorherzusagen, den Kunden bereit sind, für ein Produkt mit einer Reihe von numerischen Merkmalen zu zahlen. Wenn der vorhergesagte Preis zu hoch ist, kauft kein Kunde das Produkt, aber der Geldverlust ist niedrig, weil der Preis einfach dekrementiert werden kann. Natürlich sollte es nicht zu hoch sein, da das Produkt dann möglicherweise lange nicht mehr gekauft wird. Wenn der vorhergesagte Preis jedoch zu niedrig ist, wird das Produkt schnell gekauft, ohne dass die Möglichkeit besteht, den Preis anzupassen.
Mit anderen Worten, der Lernalgorithmus sollte leicht höhere Preise vorhersagen, die bei Bedarf dekrementiert werden können, anstatt den wahren Preis zu unterschätzen, was zu einem sofortigen Geldverlust führt.
Frage
Wie würden Sie eine Fehlermetrik entwerfen, die diese Kostenasymmetrie berücksichtigt?
Mögliche Lösung
Eine Möglichkeit, eine asymmetrische Verlustfunktion zu definieren, besteht darin, einfach mit einem Gewicht zu multiplizieren: wobei der Parameter ist, den wir anpassen können, um den Grad der Asymmetrie zu ändern. Ich habe es hier gefunden . Dies scheint am einfachsten zu sein, während der quadratische Verlust beibehalten wird.