Stellen Sie sich eine Regressionslinie vor, die an einige Daten angepasst ist.
Stellen Sie sich nun einen zusätzlichen Datenpunkt vor, einen Ausreißer in einiger Entfernung vom Hauptteil der Daten, der jedoch irgendwo entlang dieser Regressionslinie liegt.
Wenn die Regressionsgerade angepasst würde, würden sich die Koeffizienten nicht ändern. Umgekehrt hätte das Löschen des zusätzlichen Ausreißers keinen Einfluss auf die Koeffizienten.
Ein Ausreißer oder Hebelpunkt hätte also keinen Einfluss, wenn er mit den übrigen Daten und dem Modell, das der Rest impliziert, in perfekter Übereinstimmung stünde.
Wenn gewünscht, lesen Sie für "Linie" "Ebene" oder "Hyperebene", aber das einfachste Beispiel von zwei Variablen und einem Streudiagramm ist hier ausreichend.
Da Sie jedoch gerne Definitionen verwenden - anscheinend wird häufig zu viel in sie hineingelesen -, sind hier meine bevorzugten Definitionen von Ausreißern:
"Ausreißer sind Stichprobenwerte, die in Bezug auf den Großteil der Stichprobe für Überraschungen sorgen" (WN Venables und BD Ripley. 2002. Moderne angewandte Statistik mit S. New York: Springer, S.119).
Entscheidend ist, dass der Betrachter an Überraschungen denkt und von einem stillschweigenden oder expliziten Modell der Daten abhängig ist. Es kann ein anderes Modell geben, bei dem der Ausreißer überhaupt nicht überrascht, wenn die Daten tatsächlich lognormal oder gamma sind und nicht normal.
PS Ich denke nicht, dass Hebelpunkte notwendigerweise benachbarte Beobachtungen vermissen lassen. Beispielsweise können sie paarweise auftreten.