Als «histogram» getaggte Fragen

Ein Histogramm ist eine grafische Darstellung der Frequenzen einer stetigen Variablen. Die Variable ist in Bins unterteilt und für jeden Bin wird ein Balken gezeichnet, der proportional zu seiner Häufigkeit in den Daten ist.

2
Messung der Anpassungsgüte in einem Modell, das zwei Verteilungen kombiniert
Ich habe Daten mit einem Doppelpeak, die ich zu modellieren versuche, und es gibt genügend Überlappungen zwischen den Peaks, sodass ich sie nicht unabhängig behandeln kann. Ein Histogramm der Daten könnte ungefähr so ​​aussehen: Ich habe dafür zwei Modelle erstellt: eines verwendet zwei Poisson-Verteilungen und das andere verwendet zwei negative …


3
Wie berechnet man die Kullback-Leibler-Divergenz, wenn die PMF Nullen enthält?
Ich habe die folgenden Zeitreihen erhalten mit den unten angegebenen Daten. Für eine Schiebefenstergröße von 10 versuche ich, die KL-Divergenz zwischen der PMF von Werten innerhalb des aktuellen Schiebefensters und der PMF der Historie zu berechnen, mit dem Endziel, den Wert der KL-Divergenz über die Zeit so zu zeichnen, dass …

2
Wie heißt dieses „Phänomen“?
Unten finden Sie ein Histogramm einiger Daten. Die Bins sind Ganzzahlen, die anderen Parameter sind irrelevant. Wie Sie sehen können, scheint es zwei getrennte, aber überlappende Normalverteilungen für ungerade und gerade Zahlen zu geben. Die Wahrscheinlichkeit, eine gerade Zahl zu sein, beträgt 1/3, bei einer ungeraden Zahl ebenfalls 2/3. Ich …


3
Ein konkretes Beispiel ist die Durchführung einer SVD, um fehlende Werte zu unterstellen
Ich habe die großartigen Kommentare zum Umgang mit fehlenden Werten vor dem Anwenden von SVD gelesen, möchte aber anhand eines einfachen Beispiels wissen, wie dies funktioniert: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Wenn ich in der …
8 r  missing-data  data-imputation  svd  sampling  matlab  mcmc  importance-sampling  predictive-models  prediction  algorithms  graphical-model  graph-theory  r  regression  regression-coefficients  r-squared  r  regression  modeling  confounding  residuals  fitting  glmm  zero-inflation  overdispersion  optimization  curve-fitting  regression  time-series  order-statistics  bayesian  prior  uninformative-prior  probability  discrete-data  kolmogorov-smirnov  r  data-visualization  histogram  dimensionality-reduction  classification  clustering  accuracy  semi-supervised  labeling  state-space-models  t-test  biostatistics  paired-comparisons  paired-data  bioinformatics  regression  logistic  multiple-regression  mixed-model  random-effects-model  neural-networks  error-propagation  numerical-integration  time-series  missing-data  data-imputation  probability  self-study  combinatorics  survival  cox-model  statistical-significance  wilcoxon-mann-whitney  hypothesis-testing  distributions  normal-distribution  variance  t-distribution  probability  simulation  random-walk  diffusion  hypothesis-testing  z-test  hypothesis-testing  data-transformation  lognormal  r  regression  agreement-statistics  classification  svm  mixed-model  non-independent  observational-study  goodness-of-fit  residuals  confirmatory-factor  neural-networks  deep-learning 

1
Optimale Anzahl von Behältern im Histogramm nach der Freedman-Diaconis-Regel: Differenz zwischen theoretischer Rate und tatsächlicher Anzahl
Wikipedia berichtet, dass nach der Freedman- und Diaconis-Regel die optimale Anzahl von Behältern in einem Histogramm wachsen solltekkk k ∼ n1 / 3k∼n1/3k\sim n^{1/3} Dabei ist die Stichprobengröße.nnn Wenn Sie sich jedoch die nclass.FDFunktion in R ansehen , die diese Regel implementiert, zumindest mit Gaußschen Daten, und wenn , scheint …

2
Optimale Behälterbreite für zweidimensionales Histogramm
Es gibt viele Regeln für die Auswahl einer optimalen Behälterbreite in einem 1D-Histogramm (siehe zum Beispiel ). Ich suche nach einer Regel, die die Auswahl optimaler Breiten gleicher Bin auf zweidimensionale Histogramme anwendet . Gibt es eine solche Regel? Vielleicht kann eine der bekannten Regeln für 1D-Histogramme leicht angepasst werden. …

2
Dichteschätzung mit abgeschnittener Verteilung?
Ich habe einige Daten, die links deutlich abgeschnitten sind. Ich möchte es mit einer Dichteschätzung ausstatten, die es irgendwie handhabt, anstatt zu versuchen, es zu glätten. Welche bekannten Methoden (wie in R üblich) können dies beheben? Beispielcode: set.seed(1341) x <- c(runif(30, 0, 0.01), rnorm(100,3)) hist(x, br = 10, freq = …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.