Ich habe das Modell mit optimiert caret, aber dann das Modell mit dem gbmPaket erneut ausgeführt. Nach meinem Verständnis sollten das verwendete caretPaket gbmund die Ausgabe identisch sein. Nur ein kurzer Testlauf mit data(iris)zeigt jedoch eine Diskrepanz im Modell von etwa 5% unter Verwendung von RMSE und R ^ 2 …
Ich habe einen sehr großen Datensatz und es fehlen ungefähr 5% zufällige Werte. Diese Variablen sind miteinander korreliert. Der folgende Beispiel-R-Datensatz ist nur ein Spielzeugbeispiel mit Dummy-korrelierten Daten. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep …
Bitte entschuldigen Sie im Voraus, falls eine der von mir verwendeten Begriffe nicht korrekt ist. Ich würde jede Korrektur begrüßen. Wenn das, was ich als "Abschaltung" beschreibe, einen anderen Namen hat, lass es mich wissen und ich kann die Frage aktualisieren. Die Situation, die mich interessiert, ist folgende: Sie haben …
Ich habe einen Zeitreihendatensatz, an den ich ein Hidden Markov Model (HMM) anpasse, um die Anzahl der latenten Zustände in den Daten abzuschätzen. Mein Pseudocode dafür ist der folgende: for( i in 2 : max_number_of_states ){ ... calculate HMM with i states ... optimal_number_of_states = "model with smallest BIC" ... …
Hinweis: Diese Frage ist ein Repost, da meine vorherige Frage aus rechtlichen Gründen gelöscht werden musste. Beim Vergleich von PROC MIXED von SAS mit der Funktion lmeaus dem nlmePaket in R bin ich auf einige verwirrende Unterschiede gestoßen. Insbesondere unterscheiden sich die Freiheitsgrade in den verschiedenen Tests zwischen PROC MIXEDund …
Ich möchte einige Daten modellieren, bin mir jedoch nicht sicher, welchen Modelltyp ich verwenden kann. Ich habe Zähldaten und möchte ein Modell, das parametrische Schätzungen sowohl des Mittelwerts als auch der Varianz der Daten liefert. Das heißt, ich habe verschiedene Vorhersagefaktoren und möchte feststellen, ob einer von ihnen die Varianz …
Ich möchte bei der Verteilung verwenden, um Asset-Renditen mit kurzen Intervallen in einem Bayes'schen Modell zu modellieren. Ich möchte beide Freiheitsgrade (zusammen mit anderen Parametern in meinem Modell) für die Verteilung schätzen. Ich weiß, dass Anlagenrenditen nicht ganz normal sind, aber darüber hinaus weiß ich nicht viel. Was ist eine …
Ich suche ein Modell zwischen den Energiekursen und dem Wetter. Ich habe den Preis des MWatt zwischen den Ländern Europas gekauft und viele Werte auf das Wetter (Grib-Dateien). Jede Stunde in einem Zeitraum von 5 Jahren (2011-2015). Preis / Tag Dies ist pro Tag für ein Jahr. Ich habe dies …
Ich wollte den genauen Test des Fischers besser verstehen, deshalb habe ich das folgende Spielzeugbeispiel entwickelt, bei dem f und m männlich und weiblich und n und y dem "Sodakonsum" wie folgt entsprechen: > soda_gender f m n 0 5 y 5 0 Dies ist natürlich eine drastische Vereinfachung, aber …
Jeder, der Baseball folgt, hat wahrscheinlich von der aus dem Nichts stammenden MVP-Leistung von Jose Bautista aus Toronto gehört. In den letzten vier Jahren erzielte er ungefähr 15 Homeruns pro Saison. Letztes Jahr erreichte er 54, eine Zahl, die von nur 12 Spielern in der Baseballgeschichte übertroffen wurde. Im Jahr …
Joshua Epstein schrieb einen Artikel mit dem Titel "Warum Model?" verfügbar unter http://www.santafe.edu/media/workingpapers/08-09-040.pdf, in dem 16 Gründe angegeben sind: Erklären (sehr verschieden von vorhersagen) Leitfaden Datenerfassung Kerndynamik beleuchten Schlagen Sie dynamische Analogien vor Entdecke neue Fragen Fördern Sie eine wissenschaftliche Geistesgewohnheit Gebundene (Klammer) Ergebnisse zu plausiblen Bereichen Kernunsicherheiten beleuchten. Bieten …
Das mgcvPaket für Rhat zwei Funktionen zum Anpassen von Tensorproduktwechselwirkungen: te()und ti(). Ich verstehe die grundlegende Arbeitsteilung zwischen den beiden (Anpassen einer nichtlinearen Wechselwirkung vs. Zerlegen dieser Wechselwirkung in Haupteffekte und eine Wechselwirkung). Was ich nicht verstehe, ist warum te(x1, x2)und ti(x1) + ti(x2) + ti(x1, x2)kann (leicht) unterschiedliche Ergebnisse …
Kann jemand bitte erklären, warum wir logarithmische lineare Modelle sehr laienhaft verwenden? Ich komme aus dem Ingenieurwesen, und das ist wirklich ein schwieriges Thema für mich, also Statistik. Ich werde für eine Antwort dankbar sein.
Ich habe Fragen, die vom jüngsten Rekrutierungsskandal bei Amazon inspiriert wurden, bei dem ihnen die Diskriminierung von Frauen in ihrem Rekrutierungsprozess vorgeworfen wurde. Mehr Infos hier : Die Spezialisten für maschinelles Lernen von Amazon.com Inc haben ein großes Problem aufgedeckt: Ihre neue Rekrutierungs-Engine mochte keine Frauen. Das Team hatte seit …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.