Ich versuche, eine Antwortvariable in der linearen Regression vorherzusagen, die immer positiv sein sollte (Kosten pro Klick). Es ist ein Geldbetrag. Bei AdWords zahlen Sie Google für Klicks auf Ihre Anzeigen. Eine negative Zahl bedeutet, dass Google Sie bezahlt, wenn Nutzer auf Folgendes klicken: P.
Die Prädiktoren sind alle kontinuierliche Werte. Rsquared und RMSE sind im Vergleich zu anderen Modellen anständig, auch außerhalb der Stichprobe:
RMSE Rsquared
1.4141477 0.8207303
Ich kann die Vorhersagen nicht neu skalieren, da es sich um Geld handelt, sodass selbst ein kleiner Neuskalierungsfaktor die Kosten erheblich verändern kann.
Soweit ich weiß, gibt es für das Regressionsmodell nichts Besonderes an Null und negativen Zahlen, sodass die beste Regressionshyperebene gefunden wird, unabhängig davon, ob die Ausgabe teilweise negativ ist.
Dies ist ein allererster Versuch, bei dem alle Variablen verwendet werden, die ich habe. Es gibt also Raum für Verfeinerung.
Gibt es eine Möglichkeit, dem Modell mitzuteilen, dass die Ausgabe nicht negativ sein kann?