Als «time-series» getaggte Fragen

Zeitreihen sind Daten, die über die Zeit beobachtet werden (entweder in kontinuierlicher Zeit oder in diskreten Zeiträumen).

2
Ist jede nichtstationäre Serie durch Differenzierung auf eine stationäre Serie umrüstbar?
Kann jede nicht stationäre Zeitreihe durch Differenzierung in eine stationäre Zeitreihe umgewandelt werden? Wie bestimmen Sie außerdem die Reihenfolge der anzuwendenden Differenzierung? Unterscheiden Sie sich nur mit den Intervallen 1,2 ... n und führen Sie jedes Mal einen Einheitswurzeltest für stationär durch, um festzustellen, ob die resultierende Reihe stationär ist?

1
GBM-Paket vs. Caret mit GBM
Ich habe das Modell mit optimiert caret, aber dann das Modell mit dem gbmPaket erneut ausgeführt. Nach meinem Verständnis sollten das verwendete caretPaket gbmund die Ausgabe identisch sein. Nur ein kurzer Testlauf mit data(iris)zeigt jedoch eine Diskrepanz im Modell von etwa 5% unter Verwendung von RMSE und R ^ 2 …



5
Wie führt man eine Imputation von Werten in einer sehr großen Anzahl von Datenpunkten durch?
Ich habe einen sehr großen Datensatz und es fehlen ungefähr 5% zufällige Werte. Diese Variablen sind miteinander korreliert. Der folgende Beispiel-R-Datensatz ist nur ein Spielzeugbeispiel mit Dummy-korrelierten Daten. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

2
Welche Statistiken werden unter Aggregation aufbewahrt?
Wenn wir über lange Zeitreihen mit hoher Auflösung und viel Rauschen verfügen, ist es oft sinnvoll, die Daten zu einer niedrigeren Auflösung zu aggregieren (z. B. tägliche bis monatliche Werte), um ein besseres Verständnis der Vorgänge zu erhalten und einige davon effektiv zu entfernen der Lärm. Ich habe mindestens eine …

1
Kriterien für die Auswahl des „besten“ Modells in einem Hidden-Markov-Modell
Ich habe einen Zeitreihendatensatz, an den ich ein Hidden Markov Model (HMM) anpasse, um die Anzahl der latenten Zustände in den Daten abzuschätzen. Mein Pseudocode dafür ist der folgende: for( i in 2 : max_number_of_states ){ ... calculate HMM with i states ... optimal_number_of_states = "model with smallest BIC" ... …

2
Zusammenhang und Differenz zwischen Zeitreihen und Regression?
Was sind Beziehung und Unterschied zwischen Zeitreihen und Regression? Ist es für Modelle und Annahmen richtig, dass die Regressionsmodelle die Unabhängigkeit zwischen den Ausgabevariablen für verschiedene Werte der Eingabevariablen annehmen, während das Zeitreihenmodell dies nicht tut? Was sind noch einige andere Unterschiede? Für Methoden von einer Website von Darlington Es …

1
Algorithmus zur Echtzeitnormalisierung von Zeitreihendaten?
Ich arbeite an einem Algorithmus, der einen Vektor des neuesten Datenpunkts aus einer Reihe von Sensorströmen aufnimmt und den euklidischen Abstand mit vorherigen Vektoren vergleicht. Das Problem ist, dass die verschiedenen Datenströme von völlig verschiedenen Sensoren stammen, sodass bei einer einfachen euklidischen Entfernung einige Werte dramatisch überbetont werden. Klar, ich …

1
Erste Schritte zur Vorhersage finanzieller Zeitreihen durch maschinelles Lernen
Ich versuche zu verstehen, wie man maschinelles Lernen eins oder mehr Schritte in die Zukunft voraussagt. Ich habe eine finanzielle Zeitserie mit einigen beschreibenden Daten und möchte ein Modell bilden und dann das Modell verwenden, um n-Schritte vorauszusagen. Was ich bisher gemacht habe, ist: getSymbols("GOOG") GOOG$sma <- SMA(Cl(GOOG)) GOOG$range <- …


1
Saisonbereinigung der Zähldaten
Ich habe stl () in R verwendet, um die Zähldaten in Trend-, saisonale und unregelmäßige Komponenten zu zerlegen. Die resultierenden Trendwerte sind keine ganzen Zahlen mehr. Ich habe folgende Fragen: Ist stl () eine geeignete Methode, um die Saison für Zählungsdaten zu entziehen? Kann ich lm () verwenden, um die …


4
Differenzzeitreihen vor Arima oder innerhalb von Arima
Ist es besser, eine Reihe zu unterscheiden (vorausgesetzt, sie wird benötigt), bevor ein Arima verwendet wird, ODER besser, den Parameter d in Arima zu verwenden? Ich war überrascht, wie unterschiedlich die angepassten Werte sind, je nachdem, welche Route mit demselben Modell und denselben Daten gefahren wird. Oder mache ich etwas …
12 r  time-series  arima 

1
Unterschiede zwischen PROC Mixed und lme / lmer in R - Freiheitsgraden
Hinweis: Diese Frage ist ein Repost, da meine vorherige Frage aus rechtlichen Gründen gelöscht werden musste. Beim Vergleich von PROC MIXED von SAS mit der Funktion lmeaus dem nlmePaket in R bin ich auf einige verwirrende Unterschiede gestoßen. Insbesondere unterscheiden sich die Freiheitsgrade in den verschiedenen Tests zwischen PROC MIXEDund …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.