Ich versuche, die Schätzung der Kerneldichte besser zu verstehen.
Verwendung der Definition aus Wikipedia: https://en.wikipedia.org/wiki/Kernel_density_estimation#Definition
Nehmen wir als rechteckige Funktion, die ergibt, wenn zwischen und und andernfalls , und (Fenstergröße) als 1.1 x - 0,5 0,5 0 h
Ich verstehe, dass die Dichte eine Faltung von zwei Funktionen ist, aber ich bin nicht sicher, wie ich diese beiden Funktionen definieren soll. Eine davon sollte (wahrscheinlich) eine Funktion der Daten sein, die uns für jeden Punkt in R mitteilen, wie viele Datenpunkte wir an diesem Ort haben (meistens ). Und die andere Funktion sollte wahrscheinlich eine Modifikation der Kernelfunktion in Kombination mit der Fenstergröße sein. Aber ich bin nicht sicher, wie ich es definieren soll.
Irgendwelche Vorschläge?
Unten sehen Sie einen Beispiel-R-Code, der (vermutlich) die oben definierten Einstellungen (mit einer Mischung aus zwei Gaußschen und ) reproduziert. Ich hoffe, einen "Beweis" dafür zu sehen, dass die zu verschachtelnden Funktionen unseren Vorstellungen entsprechen .
# example code:
set.seed(2346639)
x <- c(rnorm(50), rnorm(50,2))
plot(density(x, kernel='rectangular', width=1, n = 10**4))
rug(x)