Wie kann ich den abgeschnittenen oder abgeschnittenen Mittelwert berechnen? Sagen wir um 10% abgeschnitten?
Ich kann mir vorstellen, wie es geht, wenn Sie 10 Einträge oder so haben, aber wie kann ich es für viele Einträge tun?
Wie kann ich den abgeschnittenen oder abgeschnittenen Mittelwert berechnen? Sagen wir um 10% abgeschnitten?
Ich kann mir vorstellen, wie es geht, wenn Sie 10 Einträge oder so haben, aber wie kann ich es für viele Einträge tun?
Antworten:
Der getrimmte Mittelwert beinhaltet das Trimmen von Prozent-Beobachtungen von beiden Enden.
Beispiel: Wenn Sie aufgefordert werden, einen um 10% getrimmten Mittelwert zu berechnen, ist .
Angesichts einer Reihe von Beobachtungen hat :
Wenn eine ganze Zahl ist, verwenden Sie und schneiden Sie Beobachtungen an beiden Enden ab.
= verbleibende Beobachtungen = .
Beschnittener Mittelwert =
Beispiel : Finden Sie 10% getrimmten Mittelwert von
2, 4, 6, 7, 11, 21, 81, 90, 105, 121
Hier ist was eine ganze Zahl ist. Trimmen Sie also genau eine Beobachtung an jedem Ende, da . Schneiden Sie also 2 und 121 ab. Wir haben Beobachtungen.
10% getrimmter Mittelwert = (1/8) * (4 + 6 + 7 + 11 + 21 + 81 + 90 + 105) = 40,625
Wenn in ein Bruchteil vorhanden ist, ist der getrimmte Mittelwert etwas komplizierter. Wenn wir im obigen Beispiel einen um 15% getrimmten Mittelwert wollten, ist . Dies hat den ganzzahligen Teil 1 und der Bruchteil 0,5 ist vorhanden. . Somit bleiben Beobachtungen erhalten.P = 15 , p = 0,15 , n = 10 , k = n p = 1,5 R = n - 2 k = 10 - 2 ≤ 1,5 = 10 - 3 = 7 R = 7
Nachtrag zu @ whubers Kommentar: Um unvoreingenommen zu bleiben (nach dem Entfernen von 2 und 121), müssen wir anscheinend die Hälfte der 4 und die Hälfte der 105 entfernen, um einen getrimmten Mittelwert von
Quelle: Klassennotizen zum um P Prozent getrimmten Mittelwert
$X_i$
Wenn zusätzlich zu der obigen Antwort viele Einträge vorhanden sind (z. B. n), dauert das erste Sortieren diese Zeit O (n log n). Es gibt jedoch eine zeitlineare Lösung.
Berechnen Sie das P-Quantil L und das (1-P) -Quantil U. Hierfür gibt es einen einfachen (Quicksort-ähnlichen) Algorithmus, der in der erwarteten linearen Zeit abläuft. Es gibt auch einen komplizierteren Algorithmus, der im schlimmsten Fall eine lineare Zeit ausführt. Beides findet sich zum Beispiel in: Cormen, Leiserson, Rivest, Stein: Einführung in die Algortithmen.
Scannen Sie alle Werte und addieren Sie diese zwischen L und U. Dies dauert offensichtlich linear.
Wenn es Bindungen gibt und die berechneten Quantile mehrmals zwischen den Werten existieren, haben wir möglicherweise zu viele oder zu wenige Werte hinzugefügt und müssen dies möglicherweise entsprechend korrigieren. Da wir wissen, wie viele Zahlen wir in Schritt 2 hinzugefügt haben und wie oft wir L und U gesehen haben, kann dies in konstanter Zeit erfolgen.
Teilen Sie die Gesamtsumme durch die Anzahl der Summanden.
Beachten Sie, dass sich das obige Rezept nur lohnt, wenn n wirklich groß ist und das Sortieren aller Rezepte ein Leistungseinbruch wäre, vielleicht ein paar Millionen.