Als «predictive-models» getaggte Fragen

Vorhersagemodelle sind statistische Modelle, deren Hauptzweck darin besteht, andere Beobachtungen eines Systems optimal vorherzusagen, im Gegensatz zu Modellen, deren Zweck darin besteht, eine bestimmte Hypothese zu testen oder ein Phänomen mechanistisch zu erklären. Vorhersagemodelle legen daher weniger Wert auf Interpretierbarkeit als vielmehr auf Leistung.

2
Warum werden in der Bayes'schen Folgerung einige Begriffe aus der posterioren Vorhersage gestrichen?
In Kevin Murphys Conjugate Bayesian-Analyse der Gaußschen Verteilung schreibt er, dass die posteriore prädiktive Verteilung ist p(x∣D)=∫p(x∣θ)p(θ∣D)dθp(x∣D)=∫p(x∣θ)p(θ∣D)dθ p(x \mid D) = \int p(x \mid \theta) p(\theta \mid D) d \theta Dabei ist die Daten, an die das Modell angepasst ist, und sind unsichtbare Daten. Was ich nicht verstehe ist, warum …


1
Warum sollte Netflix von seinem Fünf-Sterne-Bewertungssystem zu einem Like / Dislike-System wechseln?
Netflix stützte seine Vorschläge auf die von einem Benutzer eingereichten Bewertungen anderer Filme / Shows. Dieses Bewertungssystem hatte fünf Sterne. Mit Netflix können Benutzer jetzt Filme / Shows mögen / nicht mögen (Daumen hoch / Daumen runter). Sie behaupten, es sei einfacher, Filme zu bewerten. Wäre diese 2-Wege-Klassifizierung nicht statistisch …

1
Wie man die Ergebnisse interpretiert, wenn sowohl Grat als auch Lasso getrennt gut abschneiden, aber unterschiedliche Koeffizienten erzeugen
Ich führe sowohl mit Lasso als auch mit Ridge ein Regressionsmodell durch (um eine diskrete Ergebnisvariable im Bereich von 0 bis 5 vorherzusagen). Bevor ich das Modell ausführe, verwende ich die SelectKBestMethode scikit-learn, um den Funktionsumfang von 250 auf 25 zu reduzieren . Ohne eine anfängliche Merkmalsauswahl ergeben sowohl Lasso …



3
Regression mit verzerrten Daten
Der Versuch, die Anzahl der Besuche anhand der demografischen Daten und des Service zu berechnen. Die Daten sind sehr verzerrt. Histogramme: qq-Diagramme (links ist log): m <- lm(d$Visits~d$Age+d$Gender+city+service) m <- lm(log(d$Visits)~d$Age+d$Gender+city+service) cityund servicesind Faktorvariablen. Ich bekomme einen niedrigen p-Wert *** für alle Variablen, aber ich bekomme auch ein niedriges r-Quadrat …

2
Entscheidungsbäume und Regression - Können vorhergesagte Werte außerhalb des Bereichs der Trainingsdaten liegen?
Kann der vorhergesagte Wert bei Entscheidungsbäumen außerhalb des Bereichs der Trainingsdaten liegen? Wenn der Trainingsdatensatzbereich der Zielvariablen beispielsweise 0-100 beträgt, können meine Werte beim Generieren und Anwenden meines Modells auf etwas anderes -5 sein? oder 150? Da ich die Regression von Entscheidungsbäumen so verstehe, dass sie immer noch auf Regeln …





1
Konfidenzintervalle für Zeitreihendifferenzen
Ich habe ein stochastisches Modell, das verwendet wird, um Zeitreihen eines Prozesses zu simulieren. Ich interessiere mich für den Effekt der Änderung eines Parameters auf einen bestimmten Wert und möchte den Unterschied zwischen der Zeitreihe (z. B. Modell A und Modell B) und einer Art simulationsbasiertem Konfidenzintervall zeigen. Ich habe …

1
Vorhersagen von Prozessen mit langem Speicher
Ich arbeite mit einem Zwei-Zustands-Prozess mit xtxtx_t in {1,−1}{1,−1}\{1, -1\} für t=1,2,…t=1,2,…t = 1, 2, \ldots Die Autokorrelationsfunktion zeigt einen Prozess mit langem Speicher an, dh sie zeigt einen Potenzgesetzabfall mit einem Exponenten <1 an. Sie können eine ähnliche Reihe in R simulieren mit: > library(fArma) > x<-fgnSim(10000,H=0.8) > x<-sign(x) …

2
Was ist die Intuition hinter einem wiederkehrenden neuronalen Netzwerk mit langem Kurzzeitgedächtnis (LSTM)?
Die Idee hinter Recurrent Neural Network (RNN) ist mir klar. Ich verstehe es folgendermaßen: Wir haben eine Folge von Beobachtungen ( Ö⃗ 1, o⃗ 2, … , O.⃗ no→1,o→2,…,o→n\vec o_1, \vec o_2, \dots, \vec o_n ) (oder mit anderen Worten multivariate Zeitreihen). Jede einzelne Beobachtung Ö⃗ icho→i\vec o_i ist ein …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.