In Kahneman und Deaton (2010) † schreiben die Autoren Folgendes:
Diese Regression erklärt 37% der Varianz mit einem quadratischen mittleren Fehler (RMSE) von 0,67852. Um Ausreißer und unplausible Einkommensberichte zu eliminieren, haben wir Beobachtungen fallen gelassen, bei denen der absolute Wert der Differenz zwischen dem Log-Einkommen und seiner Vorhersage das 2,5-fache des RMSE überschritt.
Ist das gängige Praxis? Was ist die Intuition dahinter? Es scheint etwas seltsam, einen Ausreißer auf der Grundlage eines Modells zu definieren, das möglicherweise überhaupt nicht genau spezifiziert ist. Sollte die Ermittlung von Ausreißern nicht auf theoretischen Gründen für einen plausiblen Wert beruhen, anstatt wie gut Ihr Modell die tatsächlichen Werte vorhersagt?
: Daniel Kahneman, Angus Deaton (2010): Ein hohes Einkommen verbessert die Bewertung des Lebens, aber nicht das emotionale Wohlbefinden. Verfahren der Nationalen Akademie der Wissenschaften Sep 2010, 107 (38) 16489-16493; DOI: 10.1073 / pnas.1011492107