Angenommen, wir haben den folgenden Datenrahmen:
TY_MAX
141 1.004622
142 1.004645
143 1.004660
144 1.004672
145 1.004773
146 1.004820
147 1.004814
148 1.004807
149 1.004773
150 1.004820
151 1.004814
152 1.004834
153 1.005117
154 1.005023
155 1.004928
156 1.004834
157 1.004827
158 1.005023
159 1.005248
160 1.005355
25th: 1.0031185409705132
50th: 1.004634349800723
75th: 1.0046683578907745
Calculated 50th: 1.003893449430644
Ich bin hier etwas verwirrt. Wenn wir das 75. Przentil erhalten, sollten 75% der Daten unter diesem Perzentil liegen. Und wenn wir das 25. Perzentil erreichen können, sollten 25% der Daten unter dem 25. liegen. Jetzt denke ich, dass 50% der Daten zwischen dem 25. und 50. liegen sollten. Und auch das 50. Perzentil gibt mir einen anderen Wert. Fair genug, was bedeutet, dass 50% der Daten unter diesem Wert liegen sollten. Aber meine Frage ist, ob mein Ansatz richtig ist?
EDIT: Und können wir auch sagen, dass 98% der Daten zwischen dem 1. und 99. Perzentil liegen werden?