Als «bayesian» getaggte Fragen

Die Bayes'sche Inferenz ist eine Methode der statistischen Inferenz, die darauf beruht, die Modellparameter als Zufallsvariablen zu behandeln und den Bayes'schen Satz anzuwenden, um subjektive Wahrscheinlichkeitsaussagen über die Parameter oder Hypothesen abzuleiten, abhängig vom beobachteten Datensatz.


3
Erfordert ein Bayes-Schätzer, dass der wahre Parameter eine mögliche Abweichung vom Prior ist?
Dies mag eine philosophische Frage sein, aber hier geht es weiter: In der Entscheidungstheorie wird das Risiko eines Bayes-Schätzers für in Bezug auf eine vorherige Verteilung on definiert .θ^( x )θ^(x)\hat\theta(x)& pgr; & THgr;& thgr; ∈ & THgr;θ∈Θ\theta\in\Thetaππ\piΘΘ\Theta Einerseits muss eine mögliche Variation unter , damit das wahre die Daten …


3
Hyperebenen klassifizieren Daten optimal, wenn Eingaben bedingt unabhängig sind - warum?
In dem Artikel Deep Learning und das Prinzip des Informationsengpasses geben die Autoren in Abschnitt II A) Folgendes an: Einzelne Neuronen klassifizieren nur linear trennbare Eingaben, da sie nur Hyperebenen in ihrem Eingaberaum implementieren können . Hyperebenen können Daten optimal klassifizieren, wenn die Eingaben bedingt unabhängig sind.u=wh+bu=wh+bu = wh+b Um …


1
Warum ist das Bayes'sche glaubwürdige Intervall in dieser Polynomregression verzerrt, während das Konfidenzintervall korrekt ist?
Betrachten Sie das Diagramm unten, in dem ich Daten wie folgt simuliert habe. Wir betrachten ein binäres Ergebnis für das die wahre Wahrscheinlichkeit, 1 zu sein, durch die schwarze Linie angezeigt wird. Die funktionale Beziehung zwischen einer Kovariate und ist ein Polynom 3. Ordnung mit logistischer Verknüpfung (also in doppelter …


1
Welches Deep-Learning-Modell kann Kategorien klassifizieren, die sich nicht gegenseitig ausschließen?
Beispiele: Ich habe einen Satz in der Stellenbeschreibung: "Java Senior Engineer in UK". Ich möchte ein Deep-Learning-Modell verwenden, um es als zwei Kategorien vorherzusagen: English und IT jobs. Wenn ich ein traditionelles Klassifizierungsmodell verwende, kann es nur 1 Etikett mit softmaxFunktion auf der letzten Ebene vorhersagen . Somit kann ich …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

6
Verwenden des p-Werts zur Berechnung der Wahrscheinlichkeit, dass die Hypothese wahr ist; Was wird noch benötigt?
Frage: Ein häufiges Missverständnis von p-Werten besteht darin, dass sie die Wahrscheinlichkeit darstellen, dass die Nullhypothese wahr ist. Ich weiß, dass dies nicht korrekt ist, und ich weiß, dass p-Werte nur die Wahrscheinlichkeit darstellen, eine so extreme Stichprobe zu finden, da die Nullhypothese wahr ist. Intuitiv sollte man jedoch in …

1
Zweifel an der Ableitung von Gaußschen Prozessregressionsgleichungen in einer Arbeit
Ich lese diesen Papiervorabdruck und habe Schwierigkeiten, die Gleichungen für die Gaußsche Prozessregression abzuleiten. Sie verwenden die Einstellung und Notation von Rasmussen & Williams . Somit wird additives, mittleres, stationäres und normalverteiltes Rauschen mit Varianz angenommen:σ2noiseσnoise2\sigma^2_{noise} y=f(x)+ϵ,ϵ∼N(0,σ2noise)y=f(x)+ϵ,ϵ∼N(0,σnoise2)y=f(\mathbf{x})+\epsilon, \quad \epsilon\sim N(0,\sigma^2_{noise}) Für wird ein GP vor dem Mittelwert Null angenommen , …

1
Beispiel dafür, wie die Bayes'sche Statistik Parameter schätzen kann, deren Schätzung mit frequentistischen Methoden sehr schwierig ist
Bayesianische Statistiker behaupten, dass "Bayesianische Statistiken Parameter schätzen können, deren Schätzung mit frequentistischen Methoden sehr schwierig ist". Sagt das folgende Zitat aus dieser SAS-Dokumentation dasselbe? Es liefert Schlussfolgerungen, die von den Daten abhängig und genau sind, ohne auf asymptotische Approximation angewiesen zu sein. Die Inferenz kleiner Stichproben verläuft auf die …

2
Anwendung der stochastischen Variationsinferenz auf die Bayes'sche Mischung von Gauß'sch
Ich versuche , Gaussian Mixture Modell mit stochastischen Variations Inferenz zu implementieren, nach diesem Papier . Dies ist die pgm der Gaußschen Mischung. Dem Artikel zufolge ist der vollständige Algorithmus der stochastischen Variationsinferenz: Und ich bin immer noch sehr verwirrt über die Methode, sie auf GMM zu skalieren. Zuerst dachte …

1
Bayesianische Online-Änderungspunkterkennung (marginale prädiktive Verteilung)
Ich lese das Bayesian Online Changepoint Detection Paper von Adams und MacKay ( Link ). Die Autoren schreiben zunächst die marginale Vorhersageverteilung: wobeiP(xt+1|x1:t)=∑rtP(xt+1|rt,x(r)t)P(rt|x1:t)(1)P(xt+1|x1:t)=∑rtP(xt+1|rt,xt(r))P(rt|x1:t)(1) P(x_{t+1} | \textbf{x}_{1:t}) = \sum_{r_t} P(x_{t+1} | r_t, \textbf{x}_t^{(r)}) P(r_t | \textbf{x}_{1:t}) \qquad \qquad (1) xtxtx_t ist die Beobachtung zum Zeitpunkt ;ttt x1:tx1:t\textbf{x}_{1:t} bezeichnet die Menge der …


1
Was bedeutet es, über ein Zufallsmaß zu integrieren?
Ich schaue mir derzeit eine Arbeit des Dirichlet-Prozess-Zufallseffektmodells an und die Modellspezifikation lautet wie folgt: wobeider Skalierungsparameter unddas Basismaß ist. Später in diesem Artikel wird vorgeschlagen, eine Funktion über das Basismaßz. B. Ist das Basismaß im Dirichlet-Prozess ein PDF oder ein PDF? Was passiert, wenn das Basismaß ein Gaußscher ist?yichψichG= …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.