Als «references» getaggte Fragen

Fragen zu externen Referenzen (Bücher, Papiere usw.) zu einem bestimmten Thema. Verwenden Sie zusätzlich immer ein spezifischeres Tag.

3
Testen der Nichtlinearität in der logistischen Regression (oder anderen Formen der Regression)
Eine der Voraussetzungen für eine logistische Regression ist die Linearität des Logits. Sobald ich mein Modell zum Laufen gebracht habe, teste ich es mit dem Box-Tidwell-Test auf Nichtlinearität. Einer meiner kontinuierlichen Prädiktoren (X) wurde positiv auf Nichtlinearität getestet. Was soll ich als nächstes tun? Da dies einen Verstoß gegen die …

3
wenn
Ich weiß, dass für die stetige Variable P[X=x]=0P[X=x]=0P[X=x]=0 . Aber ich kann mir nicht vorstellen, dass wenn P[X=x]=0P[X=x]=0P[X=x]=0 , es unendlich viele mögliche xxx . Und warum werden ihre Wahrscheinlichkeiten unendlich klein?

1
Kombinieren mehrerer Metriken, um Vergleiche / Rangfolgen von k Objekten bereitzustellen [Frage und Referenzanforderung]
Sammeln von Metriken zu k Objektennnnkkk Angenommen, ich sammle Metriken über k Objekte. Ich suche nach gültigen Möglichkeiten, um die k Objekte zu vergleichen , damit sie "eingestuft" werden können. Ich denke, dass dies ein ausgetretener Boden ist (Sportstatistiken wie die gesamte Quarterback-Bewertung usw.), aber ich bin mit diesem Bereich …

5
Wie führt man eine Imputation von Werten in einer sehr großen Anzahl von Datenpunkten durch?
Ich habe einen sehr großen Datensatz und es fehlen ungefähr 5% zufällige Werte. Diese Variablen sind miteinander korreliert. Der folgende Beispiel-R-Datensatz ist nur ein Spielzeugbeispiel mit Dummy-korrelierten Daten. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 


5
Argumentieren die Bayesianer jemals, dass es Fälle gibt, in denen ihr Ansatz den frequentistischen Ansatz verallgemeinert / überschneidet?
Argumentieren Bayesianer jemals, dass ihr Ansatz den frequentistischen Ansatz verallgemeinert, weil man nicht-informative Prioritäten verwenden und daher eine typische frequentistische Modellstruktur wiederherstellen kann? Kann mich jemand an einen Ort verweisen, an dem ich über dieses Argument lesen kann, wenn es tatsächlich verwendet wird? EDIT: Diese Frage ist vielleicht nicht genau …

2
Behrens-Fisher-Problem
Gibt es einen guten veröffentlichten Expository-Bericht mit mathematischen Details zu den verschiedenen Ansätzen, die für das Behrens-Fisher-Problem verwendet wurden?


4
Referenzen für beratende Statistiker, um ihren Kunden zu bieten
Diese Frage zeigt, wie schwierig es für einen Menschen ist, Statistiken und Wahrscheinlichkeiten selbst zu beherrschen, wenn man sich mit schwach entwickelten Ressourcen wie Wikipedia auseinandersetzt. Mir ist der Gedanke gekommen, dass Berater von Statistikern, und es gibt hier einige, routinemäßig vor der Herausforderung stehen, einem Kunden bestimmte Konzepte und …


3
Übergang von der Verwendung statistischer Software zum Verständnis mathematischer Gleichungen?
Kontext: Ich bin ein Psychologie-Doktorand. Wie bei vielen Doktoranden der Psychologie weiß ich, wie man mit statistischer Software verschiedene statistische Analysen durchführt, bis hin zu Techniken wie PCA, Klassifikationsbäumen und Clusteranalyse. Aber es ist nicht wirklich befriedigend, denn obwohl ich erklären kann, warum ich eine Analyse durchgeführt habe und was …

1
Online skalierbare statistische Methoden
Dies wurde durch eine effiziente lineare Online-Regression inspiriert , die ich sehr interessant fand. Gibt es Texte oder Ressourcen, die für statistische Berechnungen in großem Maßstab vorgesehen sind, bei denen die Datenmengen zu groß sind, um in den Hauptspeicher zu passen, und die möglicherweise zu unterschiedlich sind, um eine effektive …




Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.