Ich habe einen Datensatz mit drei Variablen, wobei alle Variablen quantitativ sind. Nennen wir es , und . Ich passe ein Regressionsmodell in einer Bayes'schen Perspektive über MCMC mit anrjags
Ich habe eine explorative Analyse durchgeführt und das Streudiagramm von , dass ein quadratischer Term verwendet werden sollte. Dann habe ich zwei Modelle montiert
(1)
(2)
In Modell 1 ist die Effektgröße jedes Parameters nicht klein und das zu 95% glaubwürdige Intervall enthält nicht den Wert .
In Modell 2 ist die Effektgröße der Parameter und klein und jedes der glaubwürdigen Intervalle für alle Parameter enthält .
Die Tatsache, dass ein glaubwürdiges Intervall enthält, reicht aus, um zu sagen, dass der Parameter nicht signifikant ist?
Dann habe ich das folgende Modell angepasst
(3)
Die Effektgröße jedes Parameters ist nicht klein, aber mit Ausnahme von alle glaubwürdigen Intervalle .
Welches ist der richtige Weg, um Variablen in der Bayes'schen Statistik auszuwählen?
EDIT: Ich kann Lasso in jedem Regressionsmodell wie dem Beta-Modell verwenden. Ich verwende ein Modell mit variabler Streuung, wobei wobei ein Vektor ist. Ich sollte Laplace auch in .
EDIT2: Ich habe zwei Modelle angepasst, eines mit Gaußschem für , und eines mit Laplace (doppelt exponentiell).
Die Schätzungen für das Gaußsche Modell sind
Mean SD Naive SE Time-series SE
B[1] -1.17767 0.07112 0.0007497 0.0007498
B[2] -0.15624 0.03916 0.0004128 0.0004249
B[3] 0.15600 0.05500 0.0005797 0.0005889
B[4] 0.07682 0.04720 0.0004975 0.0005209
delta[1] -3.42286 0.32934 0.0034715 0.0034712
delta[2] 0.06329 0.27480 0.0028966 0.0028969
delta[3] 1.06856 0.34547 0.0036416 0.0036202
delta[4] -0.32392 0.26944 0.0028401 0.0028138
Die Schätzungen für das Lasso-Modell sind
Mean SD Naive SE Time-series SE
B[1] -1.143644 0.07040 0.0007421 0.0007422
B[2] -0.160541 0.05341 0.0005630 0.0005631
B[3] 0.137026 0.05642 0.0005947 0.0005897
B[4] 0.046538 0.04770 0.0005028 0.0005134
delta[1] -3.569151 0.27840 0.0029346 0.0029575
delta[2] -0.004544 0.15920 0.0016781 0.0016786
delta[3] 0.411220 0.33422 0.0035230 0.0035629
delta[4] -0.034870 0.16225 0.0017103 0.0017103
lambda 7.269359 5.45714 0.0575233 0.0592808
Die Schätzungen für und sich im Lasso-Modell reduziert. dies, dass ich diese Variablen aus dem Modell entfernen sollte?
EDIT3: Das Modell mit doppelt exponentiellem Prior (Lasso) gibt mir größere Abweichungs-, BIC- und DIC-Werte als das Modell mit Gaußschen Prioritäten, und ich erhalte sogar kleinere Werte, nachdem ich den Dispersionskoeffizienten im Gaußschen Modell entfernt habe.