Als «mathematical-statistics» getaggte Fragen

Mathematische Theorie der Statistik, die sich mit formalen Definitionen und allgemeinen Ergebnissen befasst.

1
Reicht es bei der Neuparametrierung einer Wahrscheinlichkeitsfunktion aus, nur die transformierte Variable anstelle einer Änderung der Variablenformel einzufügen?
Angenommen, ich versuche, eine Wahrscheinlichkeitsfunktion, die exponentiell verteilt ist, neu zu parametrisieren. Wenn meine ursprüngliche Wahrscheinlichkeitsfunktion lautet: p(y∣θ)=θe−θyp(y∣θ)=θe−θy p(y \mid \theta) = \theta e^{-\theta y} und ich möchte es mit neu parametrisieren , da keine Zufallsvariable ist, sondern ein Parameter, reicht es aus, nur einstecken?ϕ=1θϕ=1θ\phi = \frac{1}{\theta}θθ\theta Was ich explizit …

1
Grundlegendes zur Verwendung von Logarithmen im TF-IDF-Logarithmus
Ich habe gelesen: https://en.wikipedia.org/wiki/Tf%E2%80%93idf#Definition Aber ich kann nicht genau verstehen, warum die Formel so konstruiert wurde, wie sie ist. Was ich tue Verstehe: iDF sollte auf einer bestimmten Ebene messen, wie häufig ein Begriff S in jedem der Dokumente vorkommt, wobei der Wert abnimmt, wenn der Begriff häufiger vorkommt. Aus …

2
Was ist die maximale Wahrscheinlichkeitsschätzung der Kovarianz bivariater Normaldaten, wenn Mittelwert und Varianz bekannt sind?
Angenommen, wir haben eine Zufallsstichprobe aus einer bivariaten Normalverteilung, die Nullen als Mittelwerte und Einsen als Varianzen enthält. Der einzige unbekannte Parameter ist also die Kovarianz. Was ist die MLE der Kovarianz? Ich weiß, es sollte so etwas wie aber woher wissen wir das?1n∑nj=1xjyj1n∑j=1nxjyj\frac{1}{n} \sum_{j=1}^{n}x_j y_j


2
Was passiert bei einem t-Test mit einer Stichprobe, wenn im Varianzschätzer der Stichprobenmittelwert durch
Nehmen Sie einen t-Test mit einer Stichprobe an, bei dem die Nullhypothese . Die Statistik ist dann t = ¯ x - μ 0μ = μ0μ=μ0\mu=\mu_0 Verwendung der Stichprobenstandardabweichungs. BeiAbschätzungs, vergleicht man die Beobachtungen der Probe Mittelwert¯x:t = x¯¯¯- μ0s / n√t=x¯−μ0s/nt=\frac{\overline{x}-\mu_0}{s/\sqrt{n}}ssssssx¯¯¯x¯\overline{x} .s = 1n - 1∑ni = 1( xich- …

2
Erwarteter Wert einer Gaußschen Zufallsvariablen, die mit einer logistischen Funktion transformiert wurde
Sowohl die logistische Funktion als auch die Standardabweichung werden normalerweise als . Ich werde und s für die Standardabweichung verwenden.σσ\sigmaσ(x)=1/(1+exp(−x))σ(x)=1/(1+exp⁡(−x))\sigma(x) = 1/(1+\exp(-x))sss Ich habe eine logistische Neuron mit einem zufälligen Eingang , dessen Mittelwert und Standardabweichung ich weiß. Ich hoffe, dass der Unterschied zum Mittelwert durch ein Gaußsches Rauschen gut …

1
Sind Regressionen mit Schülerfehlern nutzlos?
Bitte bearbeiten. Wenn Sie Daten mit starken Schwänzen haben, scheint es intuitiv zu sein, eine Regression mit Schülerfehlern durchzuführen. Während ich diese Möglichkeit erkundete, stieß ich auf dieses Papier: Breusch, TS, Robertson, JC & Welsh, AH (1. November 1997). Die neue Kleidung des Kaisers: eine Kritik des multivariaten Regressionsmodells. Statistica …

2
Hypothesentest und Gesamtvariationsabstand vs. Kullback-Leibler-Divergenz
Bei meiner Forschung bin ich auf das folgende allgemeine Problem gestoßen: Ich habe zwei Verteilungen und über dieselbe Domäne und eine große (aber endliche) Anzahl von Stichproben aus diesen Verteilungen. Die Proben sind unabhängig und identisch von einer dieser beiden Verteilungen verteilt (obwohl die Verteilungen verwandt sein können: Zum Beispiel …

4
Gesamtbild zur Überlebensanalyse und Lebensdatenanalyse
Ich habe von Überlebensanalysen und Lebensdatenanalysen gehört, verstehe aber nicht ganz das Gesamtbild. Ich habe mich gefragt, welche Themen sie behandeln. Handelt es sich um reine Statistik oder nur um die Anwendung von Statistiken in einem bestimmten Bereich? Ist die Lebensdatumsanalyse Teil der Überlebensanalyse? Danke und Grüße!

3
Verteilung von wenn unabhängige -Variablen sind
Als Routineübung versuche ich, die Verteilung von wobei und unabhängige Zufallsvariablen sind.X2+Y2−−−−−−−√X2+Y2\sqrt{X^2+Y^2}XXXYYYU(0,1)U(0,1) U(0,1) Die Gelenkdichte von ist (X,Y)(X,Y)(X,Y)fX,Y(x,y)=10&lt;x,y&lt;1fX,Y(x,y)=10&lt;x,y&lt;1f_{X,Y}(x,y)=\mathbf 1_{0\cos^{-1}\left(\frac{1}{z}\right)cosθcos⁡θ\cos\thetaθ∈[0,π2]θ∈[0,π2]\theta\in\left[0,\frac{\pi}{2}\right]zsinθ&lt;1⟹θ&lt;sin−1(1z)zsin⁡θ&lt;1⟹θ&lt;sin−1⁡(1z)z\sin\theta<1\implies\theta<\sin^{-1}\left(\frac{1}{z}\right)sinθsin⁡θ\sin\thetaθ∈[0,π2]θ∈[0,π2]\theta\in\left[0,\frac{\pi}{2}\right] Für haben wir also .1&lt;z&lt;2–√1&lt;z&lt;21< z<\sqrt 2cos−1(1z)&lt;θ&lt;sin−1(1z)cos−1⁡(1z)&lt;θ&lt;sin−1⁡(1z)\cos^{-1}\left(\frac{1}{z}\right)<\theta<\sin^{-1}\left(\frac{1}{z}\right) Der Absolutwert von Jacobian der Transformation ist|J|=z|J|=z|J|=z Somit ist die Verbindungsdichte von gegeben durch(Z,Θ)(Z,Θ)(Z,\Theta) fZ,Θ(z,θ)=z1{z∈(0,1),θ∈(0,π/2)}⋃{z∈(1,2√),θ∈(cos−1(1/z),sin−1(1/z))}fZ,Θ(z,θ)=z1{z∈(0,1),θ∈(0,π/2)}⋃{z∈(1,2),θ∈(cos−1⁡(1/z),sin−1⁡(1/z))}f_{Z,\Theta}(z,\theta)=z\mathbf 1_{\{z\in(0,1),\,\theta\in\left(0,\pi/2\right)\}\bigcup\{z\in(1,\sqrt2),\,\theta\in\left(\cos^{-1}\left(1/z\right),\sin^{-1}\left(1/z\right)\right)\}} Durch Integration von erhalten wir das pdf von …

1
Wie zeichnet man einen angepassten Graphen und einen tatsächlichen Graphen der Gammaverteilung in einem Diagramm?
Laden Sie das benötigte Paket. library(ggplot2) library(MASS) Generieren Sie 10.000 Zahlen, die an die Gammaverteilung angepasst sind. x &lt;- round(rgamma(100000,shape = 2,rate = 0.2),1) x &lt;- x[which(x&gt;0)] Zeichnen Sie die Wahrscheinlichkeitsdichtefunktion, vorausgesetzt, wir wissen nicht, an welche Verteilung x angepasst ist. t1 &lt;- as.data.frame(table(x)) names(t1) &lt;- c("x","y") t1 &lt;- transform(t1,x=as.numeric(as.character(x))) …

4
Zeitdiskretes Ereignisverlaufsmodell (Überlebensmodell) in R.
Ich versuche, ein zeitdiskretes Modell in R einzubauen, bin mir aber nicht sicher, wie ich das machen soll. Ich habe gelesen, dass Sie die abhängige Variable in verschiedenen Zeilen organisieren können, eine für jede glmZeitbeobachtung , und die Funktion mit einem Logit- oder Cloglog-Link verwenden können. In diesem Sinne, ich …
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

1
Frage zur Autokovarianzfunktion der Probe
Ich lese ein Zeitreihenanalysebuch und die Formel für die Autokovarianz von Stichproben ist im Buch wie folgt definiert: γˆ( h ) = n- 1∑t = 1n - h( xt+h−x¯)(xt−x¯)γ^(h)=n−1∑t=1n−h(xt+h−x¯)(xt−x¯)\widehat{\gamma}(h) = n^{-1}\displaystyle\sum_{t=1}^{n-h}(x_{t+h}-\bar{x})(x_t-\bar{x}) mitfür . ist der Mittelwert.γˆ( - h ) = γˆ( h )γ^(−h)=γ^(h)\widehat{\gamma}(-h) = \widehat{\gamma}(h)\;≤ xh = 0 , 1 …

1
R lineare Regression kategoriale Variable "versteckter" Wert
Dies ist nur ein Beispiel, auf das ich mehrmals gestoßen bin, daher habe ich keine Beispieldaten. Ausführen eines linearen Regressionsmodells in R: a.lm = lm(Y ~ x1 + x2) x1ist eine stetige Variable. x2ist kategorisch und hat drei Werte, z. B. "Niedrig", "Mittel" und "Hoch". Die von R gegebene Ausgabe …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.