Was sind die besten Methoden, um den 'Modus' von Daten anzupassen, die aus einer kontinuierlichen Verteilung entnommen wurden?
Da der Modus für eine kontinuierliche Verteilung technisch undefiniert ist (oder?), Frage ich mich wirklich, wie Sie den gängigsten Wert finden.
Wenn Sie davon ausgehen, dass die übergeordnete Verteilung Gauß ist, können Sie die Daten bündeln und feststellen, dass der Modus der Speicherort mit den höchsten Zählwerten ist. Wie bestimmen Sie jedoch die Behältergröße? Gibt es robuste Implementierungen? (dh robust gegenüber Ausreißern). Ich verwende python
/ scipy
/ numpy
, aber ich kann wohl übersetzen , R
ohne allzu große Schwierigkeiten.