Zunächst ein allgemeiner Kommentar zum Modus:
Sie sollten diesen Ansatz nicht verwenden, um den Modus (zumindest fiktiv) kontinuierlich verteilter Daten zu ermitteln. Es ist unwahrscheinlich, dass sich Werte wiederholen (es sei denn, Sie haben wirklich große Stichproben, es wäre ein kleines Wunder, und selbst dann könnten verschiedene numerische Probleme dazu führen, dass es sich auf etwas unerwartete Weise verhält), und Sie erhalten im Allgemeinen nur den Mindestwert dafür Weg. Es wäre eine Möglichkeit, einen der globalen Modi in diskreten oder kategorialen Daten zu finden, aber ich würde es wahrscheinlich auch dann nicht so machen. Hier sind einige andere Ansätze, um den Modus für diskrete oder kategoriale Daten zu erhalten:
x = rpois(30,12.3)
tail(sort(table(x)),1) #1: category and count; if multimodal this only gives one
w=table(x); w[max(w)==w] #2: category and count; this can find more than one mode
which.max(table(x)) #3: category and *position in table*; only finds one mode
Wenn Sie nur den Wert und nicht die Anzahl oder Position wollen, names()
erhalten Sie ihn von diesen
Um Modi (es kann mehr als einen lokalen Modus geben) für kontinuierliche Daten auf grundlegende Weise zu identifizieren , können Sie die Daten (wie bei einem Histogramm) ablegen oder sie glätten ( density
z. B. verwenden) und versuchen, einen oder mehrere Modi zu finden dieser Weg.
Mit weniger Histogrammfächern ist Ihre Schätzung eines Modus weniger rauschempfindlich, aber die Position wird nicht besser als die Behälterbreite festgelegt (dh Sie erhalten nur ein Intervall). Mehr Behälter ermöglichen möglicherweise mehr Präzision innerhalb eines Behälters, aber Rauschen kann dazu führen, dass er über viele solcher Behälter hinweg springt. Eine kleine Änderung des Behälterursprungs oder der Behälterbreite kann zu relativ großen Änderungen des Modus führen. (Es gibt den gleichen Bias-Varianz-Kompromiss in allen Statistiken.)
Beachten Sie, summary
dass Sie mehrere grundlegende Statistiken erhalten.
[Sie sollten sd(x)
eher als verwenden sqrt(var(x))
; es ist klarer für eine Sache]
- -
In Bezug auf q.2 ja; Sie könnten sicherlich den Mittelwert und den Median der Daten auf einer Anzeige wie einem Histogramm oder einem Boxplot anzeigen. Sehen Sie hier einige Beispiele und Code , dass Sie in der Lage sein sollte, unabhängig von Fällen zu verallgemeinern Sie benötigen.