Als «self-study» getaggte Fragen

Eine Routineübung aus einem Lehrbuch, Kurs oder Test, die für eine Klasse oder ein Selbststudium verwendet wird. Die Richtlinie dieser Community besteht darin, "hilfreiche Hinweise" für solche Fragen zu geben, anstatt vollständige Antworten zu geben.

5
Wie führt man eine Imputation von Werten in einer sehr großen Anzahl von Datenpunkten durch?
Ich habe einen sehr großen Datensatz und es fehlen ungefähr 5% zufällige Werte. Diese Variablen sind miteinander korreliert. Der folgende Beispiel-R-Datensatz ist nur ein Spielzeugbeispiel mit Dummy-korrelierten Daten. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 



2
Was sind vollständige ausreichende Statistiken?
Ich habe Probleme beim Verstehen der vollständigen und ausreichenden Statistiken. Sei eine ausreichende Statistik.T=ΣxiT=ΣxiT=\Sigma x_i Wenn für eine Funktion mit der Wahrscheinlichkeit 1 ist , dann ist dies eine vollständig ausreichende Statistik.E[g(T)]=0E[g(T)]=0E[g(T)]=0ggg Aber was heißt das? Ich habe Beispiele für Uniform und Bernoulli gesehen (Seite 6 http://amath.colorado.edu/courses/4520/2011fall/HandOuts/umvue.pdf ), aber es …

1
Unterschiede zwischen PROC Mixed und lme / lmer in R - Freiheitsgraden
Hinweis: Diese Frage ist ein Repost, da meine vorherige Frage aus rechtlichen Gründen gelöscht werden musste. Beim Vergleich von PROC MIXED von SAS mit der Funktion lmeaus dem nlmePaket in R bin ich auf einige verwirrende Unterschiede gestoßen. Insbesondere unterscheiden sich die Freiheitsgrade in den verschiedenen Tests zwischen PROC MIXEDund …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

2
Approximation von Integralen mit Monte-Carlo-Simulation in R
Wie kann ich das folgende Integral mithilfe der MC-Simulation approximieren? ∫1- 1∫1- 1| x-y|d xd y∫-11∫-11|x-y|dxdy \int_{-1}^{1} \int_{-1}^{1} |x-y| \,\mathrm{d}x \,\mathrm{d}y Vielen Dank! Bearbeiten (in einem bestimmten Kontext): Ich versuche zu lernen, wie man Simulationen verwendet, um Integrale zu approximieren, und übe mich, wenn ich auf Schwierigkeiten stoße. Edit 2 …

5
Bessere Klassifizierung des Ausfalls bei der logistischen Regression
Vollständige Offenlegung: Dies sind Hausaufgaben. Ich habe einen Link zum Datensatz hinzugefügt ( http://www.bertelsen.ca/R/logistic-regression.sav ) Mein Ziel ist es, die Vorhersage der Kreditausfälle in diesem Datensatz zu maximieren. Jedes Modell, das ich mir bisher ausgedacht habe, sagt> 90% der Nichtausfälle voraus, aber <40% der Ausfälle, wodurch die Klassifizierungseffizienz insgesamt ~ …
12 r  logistic  spss  self-study 

4
Was führt dazu, dass Lasso bei der Funktionsauswahl instabil ist?
Bei der komprimierten Abtastung gibt es einen Satz, der garantiert, dass argmin∥c∥1subject to y=Xcargmin‖c‖1subject to y=Xc\text{argmin} \Vert c \Vert_1\\ \text{subject to } y = Xc hat eine eindeutige, spärliche Lösungccc (siehe Anhang für weitere Details). Gibt es einen ähnlichen Satz für Lasso? Wenn es einen solchen Satz gibt, garantiert er …


4
Bootstrap, Monte Carlo
Im Rahmen der Hausaufgaben wurde mir folgende Frage gestellt: Entwerfen und implementieren Sie eine Simulationsstudie, um die Leistung des Bootstraps zu untersuchen und 95% -Konfidenzintervalle für den Mittelwert einer univariaten Datenstichprobe zu erhalten. Ihre Implementierung kann in R oder SAS erfolgen. Aspekte der Leistung, die Sie möglicherweise betrachten möchten, sind …



1
Begrenzende Summe der iid Gamma-Variationen
Sei X1,X2,…X1,X2,…X_1,X_2,\ldots eine Folge von unabhängig und identisch verteilten Zufallsvariablen mit der Wahrscheinlichkeitsdichtefunktion; f(x)={12x2e−x0if x>0;otherwise.f(x)={12x2e−xif x>0;0otherwise. f(x) = \left\{ \begin{array}{ll} \frac{1}{2}x^2 e^{-x} & \mbox{if $x>0$};\\ 0 & \mbox{otherwise}.\end{array} \right. Zeigen Sie, dasslimn→∞P[X1+X2+…+Xn≥3(n−n−−√)]≥12limn→∞P[X1+X2+…+Xn≥3(n−n)]≥12\lim_{n\to \infty} P[X_1+X_2+\ldots+X_n\ge 3(n-\sqrt{n})] \ge \frac{1}{2} Was ich versucht habe Auf den ersten Blick dachte ich, es sollte Chebyshevs …

2
Wenn und unabhängige Normalvariablen mit jeweils dem Mittelwert Null sind, ist ebenfalls eine Normalvariable
Ich versuche die Aussage zu beweisen: Wenn und unabhängige Zufallsvariablen sind,X ∼ N ( 0 , σ 2 1 ) X∼N(0,σ21)X\sim\mathcal{N}(0,\sigma_1^2)Y ∼ N ( 0 , σ 2 2 )Y∼N(0,σ22)Y\sim\mathcal{N}(0,\sigma_2^2) dann ist X Y.√X 2 + Y 2XYX2+Y2√\frac{XY}{\sqrt{X^2+Y^2}} auch eine normale Zufallsvariable. Für den Sonderfall σ 1 = σ 2 …


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.