Ich verwende das Causal Impact-Paket in R, um auf den kausalen Effekt einer Intervention in einige Daten zu schließen, die stark korreliert und saisonal sind.
Insbesondere habe ich 17 Tage stündliche Daten erhalten, wobei die Intervention am Ende von Tag 13 erfolgt. Ich habe zwei Kontrolldatensätze, die von der Intervention überhaupt nicht betroffen sind (mit linearen Korrelationen von 0,708 und 0,701), und den Datensatz, der die Intervention enthält ( aka "behandelt")
Ein Teil der Daten finden Sie hier
Mein Code lautet wie folgt
days <- 4
daily.obser <- days*24
data.1 <- cbind(treated.signal.3n,the.control.3,the.control.2)
data.1 <- data.1[1:((length(bsl)+1)+daily.obser), ] #check the required amount of data only
matplot(data.1, type = "l",col = c(2,4,9))
legend("bottomright", inset=.05, legend=c("Treated Zone", "Control Zone 1", "Control Zone 2"), pch=1, col=c(2,4,9), horiz=TRUE)
preperiod <- c(1,length(bsl))
postperiod <- c((length(bsl)+1),(length(bsl)+1+daily.obs))
prior.level.sd.level <- 0.01
imp.1 <- CausalImpact(data.1, pre.period = preperiod, post.period = postperiod,
model.args = list(niter = 2500,nseasons=17, season.duration = 24,
dynamic.regression = FALSE, prior.level.sd =prior.level.sd.level,standardize.data = TRUE))
summary(imp.1)
plot(imp.1,c("original","pointwise"))
summary(imp.1,"report")
Meine Fragen sind:
Ich habe das Papier gelesen und irgendwann geht es um die vorherige Verteilung der Varianz. Ich verstehe nicht, auf was ich meinen prior.level.sd
Parameter basierend auf meinen Daten einstellen soll .
Ein weiteres Problem sind die nseasons,season.duration
Argumente. Wenn ich dies spezifiziere, bekomme ich in den Ergebnissen, dass die Intervention unbedeutend ist (und die CIs werden riesig), während die Intervention signifikant ist, wenn ich dies nicht tue. Soll nseasons
die Anzahl der Tage für den gesamten Datensatz oder nur für den Zeitraum vor der Intervention (z. B. 17 oder 13) angegeben werden? Was bedeutet es wirklich, die Saisonalität anzugeben? Kann ich das anhand der Daten überspringen?
Ergebnisse mit Plots und Zahlen der Saisonalitätsspezifikation
Ergebnisse ohne Diagramme und Zahlen der Saisonalitätsspezifikation
(nicht kumulativ, da es in meinem Fall nicht nützlich ist)
(Sie werden feststellen, dass die Passform in der Zeit vor der Intervention nicht so gut ist. Kann ich das irgendwie beheben?)
Ich verstehe nicht, wie ich angeben soll, ob ich die Daten standardisieren möchte oder nicht.
Schließlich denke ich über statische oder dynamische Regression nach. Ich habe in der Zeitung gelesen, dass es ratsam ist, statisch zu verwenden, wenn die Beziehung zwischen Kontrolle und Behandlung stabil ist. Kann jemand erklären, was unter Stall zu verstehen ist?
Das Papier finden Sie hier