Wenn Ihr Hauptinteresse zweidimensionale Probleme sind, würde ich sagen, dass die Kernel-Dichteschätzung eine gute Wahl ist, da sie schöne asymptotische Eigenschaften hat (beachten Sie, dass ich nicht sage, dass es die beste ist). Siehe zum Beispiel
Parzen, E. (1962). Bei Schätzung einer Wahrscheinlichkeitsdichtefunktion und -mode . Annals of Mathematical Statistics 33: 1065–1076.
de Valpine, P. (2004). Monte-Carlo-Zustandsraumwahrscheinlichkeiten durch gewichtete Schätzung der posterioren Kerndichte . Journal of the American Statistical Association 99: 523 & ndash; 536.
Für höhere Dimensionen (4+) ist diese Methode aufgrund der bekannten Schwierigkeit bei der Schätzung der optimalen Bandbreitenmatrix sehr langsam, siehe .
Das Problem mit dem Befehl ks
im Paket KDE
besteht nun, wie Sie bereits erwähnt haben, darin, dass die Dichte in einem bestimmten Raster ausgewertet wird, was sehr einschränkend sein kann. Dieses Problem kann behoben werden, wenn Sie das Paket KDE
zum Schätzen der Bandbreitenmatrix verwenden, indem Sie beispielsweise Hscv
den Kernel-Dichteschätzer implementieren und diese Funktion dann mit dem Befehl optimieren optim
. Dies wird unten anhand simulierter Daten und eines Gaußschen Kernels in gezeigt R
.
rm(list=ls())
# Required packages
library(mvtnorm)
library(ks)
# simulated data
set.seed(1)
dat = rmvnorm(1000,c(0,0),diag(2))
# Bandwidth matrix
H.scv=Hlscv(dat)
# [Implementation of the KDE](http://en.wikipedia.org/wiki/Kernel_density_estimation)
H.eig = eigen(H.scv)
H.sqrt = H.eig$vectors %*% diag(sqrt(H.eig$values)) %*% solve(H.eig$vectors)
H = solve(H.sqrt)
dH = det(H.scv)
Gkde = function(par){
return( -log(mean(dmvnorm(t(H%*%t(par-dat)),rep(0,2),diag(2),log=FALSE)/sqrt(dH))))
}
# Optimisation
Max = optim(c(0,0),Gkde)$par
Max
Formbeschränkte Schätzer sind beispielsweise tendenziell schneller
Cule, ML, Samworth, RJ und Stewart, MI (2010). Maximum-Likelihood-Schätzung einer mehrdimensionalen log-konkaven Dichte . Journal Royal Statistical Society B 72: 545–600.
Aber sie sind zu hoch für diesen Zweck.
4
Andere Methoden, die Sie in Betracht ziehen könnten, sind: Anpassen einer multivariaten endlichen Mischung von Normalen (oder anderen flexiblen Verteilungen) oder
Abraham, C., Biau, G. und Cadre, B. (2003). Einfache Schätzung des Modus einer multivariaten Dichte . The Canadian Journal of Statistics 31: 23–34.
Ich hoffe das hilft.