Um Waynes ausgezeichnete Antwort zu erweitern, ppml
wird eine robuste (bis heteroskedastische) Varianz-Kovarianz-Matrix sowie eine endliche Stichprobenanpassung an diese Matrix verwendet, um die Verzerrung zu verringern.
Diese sind sehr ähnlich zu dem, was sandwich()
aus dem gleichnamigen Paket in R berechnet wird. Der einzige Unterschied besteht darin, wie die Anpassung der endlichen Stichprobe durchgeführt wird. In der sandwich(...)
Funktion wird standardmäßig überhaupt keine Anpassung der endlichen Stichprobe vorgenommen, dh das Sandwich wird durch 1 / n geteilt, wobei n die Anzahl der Beobachtungen ist. Alternativ sandwich(..., adjust = TRUE)
kann verwendet werden, was durch 1 / (n - k) dividiert, wobei k die Anzahl der Regressoren ist. Stata teilt jedoch durch 1 / (n - 1).
So können Sie R dazu bringen, mit Stata übereinzustimmen, indem Sie eine benutzerdefinierte Sandwich-Varianz mit einem Anpassungsfaktor von 1 / (n-1) verwenden:
. clear
. set more off
. capture ssc install rsource
. use, clear
. saveold ~/Desktop/mock, version(12) replace
(saving in Stata 12 format, which can be read by Stata 11 or 12)
file ~/Desktop/mock.dta saved
> library("foreign")
> library("sandwich")
> library("lmtest")
> mock<-read.dta("~/Desktop/mock.dta")
> glmm<-glm(formula=y ~ x + w, family=quasipoisson(link="log"),data=mock)
> sandwich1 <- function(object, ...) sandwich(object) * nobs(object) / (nobs(object) - 1)
> coeftest(glmm,vcov=sandwich1)
z test of coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.516969 0.098062 5.2718 1.351e-07 ***
x 0.125657 0.101591 1.2369 0.2161
w 0.013410 0.710752 0.0189 0.9849
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
. ppml y x w
note: checking the existence of the estimates
Number of regressors excluded to ensure that the estimates exist: 0
Number of observations excluded: 0
note: starting ppml estimation
note: y has noninteger values
Iteration 1: deviance = 139.7855
Iteration 2: deviance = 137.7284
Iteration 3: deviance = 137.7222
Iteration 4: deviance = 137.7222
Number of parameters: 3
Number of observations: 100
Pseudo log-likelihood: -173.89764
R-squared: .01628639
Option strict is: off
| Robust
y | Coef. Std. Err. z P>|z| [95% Conf. Interval]
x | .1256565 .1015913 1.24 0.216 -.0734588 .3247718
w | .0134101 .7107518 0.02 0.985 -1.379638 1.406458
_cons | .5169689 .0980624 5.27 0.000 .3247702 .7091676
Hier ist der Stata / R-Code, der die obige Ausgabe generiert. Ich verwende rsource
, um R von Stata aus auszuführen (und Sie müssen das rpath()
Folgende anpassen , um es an Ihr Setup anzupassen), aber das ist nicht wirklich notwendig: Sie können das rsource
Teil einfach von R aus ausführen .
set more off
capture ssc install rsource
use, clear
saveold ~/Desktop/mock, version(12) replace
rsource, terminator(XXX) rpath("/usr/local/bin/R") roptions("--vanilla")
glmm<-glm(formula=y ~ x + w, family=quasipoisson(link="log"),data=mock)
sandwich1 <- function(object, ...) sandwich(object) * nobs(object) / (nobs(object) - 1)
ppml y x w
