Als «independence» getaggte Fragen

Ereignisse (oder Zufallsvariablen) sind unabhängig, wenn Informationen zu einigen von ihnen nichts über die Wahrscheinlichkeit des Auftretens (/ der Verteilung) der anderen aussagen. Bitte verwenden Sie dieses Tag NICHT für die unabhängige Variablenverwendung [Prädiktor].


3
Was sind für die Intuition einige Beispiele für unkorrelierte, aber abhängige Zufallsvariablen im wirklichen Leben?
Um zu erklären, warum unkorreliert nicht unabhängig bedeutet, gibt es mehrere Beispiele, die eine Reihe von Zufallsvariablen beinhalten, die jedoch alle so abstrakt erscheinen: 1 2 3 4 . Diese Antwort scheint sinnvoll zu sein. Meine Interpretation: Eine Zufallsvariable und ihr Quadrat mögen unkorreliert sein (da scheinbar fehlende Korrelation so …

3
Wo ist die Bombe: Wie schätzt man die Wahrscheinlichkeit, gegebene Zeilen- und Spaltensummen?
Diese Frage ist von einem Minispiel von Pokemon Soulsilver inspiriert: Stellen Sie sich vor, in diesem 5x6-Bereich sind 15 Bomben versteckt (BEARBEITEN: maximal 1 Bombe / Zelle): Wie schätzen Sie die Wahrscheinlichkeit ein, eine Bombe auf einem bestimmten Feld zu finden, wenn man die Gesamtzahl der Zeilen / Spalten berücksichtigt? …

1
Ungültige Schlussfolgerung, wenn Beobachtungen nicht unabhängig sind
In der Elementarstatistik habe ich gelernt, dass mit einem allgemeinen linearen Modell Beobachtungen unabhängig sein müssen, damit Schlussfolgerungen gültig sind. Wenn Clustering auftritt, kann die Unabhängigkeit möglicherweise nicht länger aufrecht erhalten werden, was zu ungültigen Schlussfolgerungen führt, sofern dies nicht berücksichtigt wird. Eine Möglichkeit, eine solche Clusterbildung zu berücksichtigen, besteht …



1
Für welche Art von Merkmalsauswahl kann der Chi-Quadrat-Test verwendet werden?
Hier frage ich, was andere üblicherweise tun, um den Chi-Quadrat-Test für die Merkmalsauswahl für das Ergebnis beim überwachten Lernen zu verwenden. Wenn ich das richtig verstehe, testen sie die Unabhängigkeit zwischen jedem Merkmal und dem Ergebnis und vergleichen die p-Werte zwischen den Tests für jedes Merkmal? In http://en.wikipedia.org/wiki/Pearson%27s_chi-squared_test , Der …

1
Fisher's Exact Test und hypergeometrische Verteilung
Ich wollte den genauen Test des Fischers besser verstehen, deshalb habe ich das folgende Spielzeugbeispiel entwickelt, bei dem f und m männlich und weiblich und n und y dem "Sodakonsum" wie folgt entsprechen: > soda_gender f m n 0 5 y 5 0 Dies ist natürlich eine drastische Vereinfachung, aber …

1
Für welche Verteilungen bedeutet Unkorrelation Unabhängigkeit?
Eine altehrwürdige Erinnerung in der Statistik ist "Unkorreliertheit bedeutet nicht Unabhängigkeit". Normalerweise wird diese Erinnerung durch die psychologisch beruhigende (und wissenschaftlich korrekte) Aussage ergänzt, "wenn die beiden Variablen dennoch gemeinsam normal verteilt sind , bedeutet Unkorrelation Unabhängigkeit". Ich kann die Anzahl der glücklichen Ausnahmen von eins auf zwei erhöhen: Wenn …


1
R / mgcv: Warum produzieren te () und ti () Tensorprodukte unterschiedliche Oberflächen?
Das mgcvPaket für Rhat zwei Funktionen zum Anpassen von Tensorproduktwechselwirkungen: te()und ti(). Ich verstehe die grundlegende Arbeitsteilung zwischen den beiden (Anpassen einer nichtlinearen Wechselwirkung vs. Zerlegen dieser Wechselwirkung in Haupteffekte und eine Wechselwirkung). Was ich nicht verstehe, ist warum te(x1, x2)und ti(x1) + ti(x2) + ti(x1, x2)kann (leicht) unterschiedliche Ergebnisse …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

2
Gilt der multivariate zentrale Grenzwertsatz (CLT), wenn Variablen eine perfekte zeitgleiche Abhängigkeit aufweisen?
Xi∽iidN(0,1)Xi∽iidN(0,1)X_i \overset{iid}{\backsim} \mathcal{N}(0, 1)i=1,...,ni=1,...,ni = 1, ..., nSn=1n∑i=1nXiSn=1n∑i=1nXi\begin{equation} S_n = \frac{1}{n} \sum_{i=1}^n X_i \end{equation}Tn=1n∑i=1n(X2i−1)Tn=1n∑i=1n(Xi2−1)\begin{equation} T_n = \frac{1}{n} \sum_{i=1}^n (X_i^2 - 1) \end{equation} SnSnS_nTnTnT_nn=1n=1n = 1n−−√SnnSn\sqrt{n} S_nn−−√TnnTn\sqrt{n} T_nn→∞n→∞n \rightarrow \infty Die Motivation: Meine Motivation für die Frage ergibt sich aus der Tatsache, dass es seltsam (aber wunderbar) ist, dass SnSnS_n und …


2
Test der Unabhängigkeit gegen Test der Homogenität
Ich unterrichte einen Statistik-Grundkurs und werde heute den Chi-Quadrat-Test der Unabhängigkeit für zwei Kategorien und den Test der Homogenität behandeln. Diese beiden Szenarien unterscheiden sich konzeptionell, können jedoch dieselbe Teststatistik und -verteilung verwenden. Bei einem Homogenitätstest wird angenommen, dass Grenzsummen für eine der Kategorien Teil des Entwurfs selbst sind - …

1
R lineare Regression kategoriale Variable "versteckter" Wert
Dies ist nur ein Beispiel, auf das ich mehrmals gestoßen bin, daher habe ich keine Beispieldaten. Ausführen eines linearen Regressionsmodells in R: a.lm = lm(Y ~ x1 + x2) x1ist eine stetige Variable. x2ist kategorisch und hat drei Werte, z. B. "Niedrig", "Mittel" und "Hoch". Die von R gegebene Ausgabe …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.