Als «quantiles» getaggte Fragen

Die Quantile einer Verteilung beziehen sich auf Punkte ihrer kumulativen Verteilungsfunktion. Einige gebräuchliche Quantile sind Quartile und Perzentile.

2
Online-Schätzung von Quartilen ohne Speicherung von Beobachtungen
Ich muss Quartile (Q1, Median und Q3) in Echtzeit mit einer großen Datenmenge berechnen, ohne die Beobachtungen zu speichern. Ich habe zuerst den P-Quadrat-Algorithmus (Jain / Chlamtac) ausprobiert, war aber nicht zufrieden damit (etwas zu viel CPU-Auslastung und nicht überzeugt von der Genauigkeit zumindest meines Datensatzes). Ich verwende jetzt den …


1
Quantile über eine gewichtete Stichprobe definieren
Ich habe eine gewichtete Stichprobe, für die ich Quantile berechnen möchte. 1 Wenn die Gewichte gleich sind (ob = 1 oder anders), stimmen die Ergebnisse im Idealfall mit denen von scipy.stats.scoreatpercentile()und R überein quantile(...,type=7). Ein einfacher Ansatz wäre, die Probe mit den angegebenen Gewichten zu "multiplizieren". Das ergibt effektiv ein …

2
Definition von "Perzentil"
Ich lese jetzt einen Hinweis zur Biostatistik von PMT Education und beachte die folgenden Sätze in Abschnitt 2.7: Ein Baby, das im 50. Massenperzentil geboren wurde, ist schwerer als 50% der Babys. Ein Baby, das im 25. Massenperzentil geboren wurde, ist schwerer als 75% der Babys. Ein Baby, das im …

1
R / mgcv: Warum produzieren te () und ti () Tensorprodukte unterschiedliche Oberflächen?
Das mgcvPaket für Rhat zwei Funktionen zum Anpassen von Tensorproduktwechselwirkungen: te()und ti(). Ich verstehe die grundlegende Arbeitsteilung zwischen den beiden (Anpassen einer nichtlinearen Wechselwirkung vs. Zerlegen dieser Wechselwirkung in Haupteffekte und eine Wechselwirkung). Was ich nicht verstehe, ist warum te(x1, x2)und ti(x1) + ti(x2) + ti(x1, x2)kann (leicht) unterschiedliche Ergebnisse …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

1
Warum die Cornish-Fisher-Erweiterung anstelle des Probenquantils verwenden?
Die Cornish-Fisher-Erweiterung bietet eine Möglichkeit, die Quantile einer Verteilung basierend auf Momenten abzuschätzen. (In diesem Sinne sehe ich es als Ergänzung zur Edgeworth-Erweiterung , die eine Schätzung der kumulativen Verteilung basierend auf Momenten liefert.) Ich würde gerne wissen, in welchen Situationen man die Cornish-Fisher-Erweiterung für empirische Arbeiten der vorziehen würde …

1
Erwarteter Wert als Funktion von Quantilen?
Ich habe mich gefragt, wo es eine allgemeine Formel gibt, um den erwarteten Wert einer kontinuierlichen Zufallsvariablen als Funktion der Quantile desselben rv in Beziehung zu setzen. Der erwartete Wert von rv ist definiert als: und Quantile sind definiert als: für .XXX E(X)=∫xdFX(x)E(X)=∫xdFX(x)E(X) = \int x dF_X(x) QpX={x:FX(x)=p}=F−1X(p)QXp={x:FX(x)=p}=FX−1(p)Q^p_X = \{x …

1
Referenzen: Schwanz des inversen cdf
Ich bin mir fast sicher, dass ich das folgende Ergebnis bereits in der Statistik gesehen habe, aber ich kann mich nicht erinnern, wo. Wenn eine positive Zufallsvariable ist und dann wenn , wobei ist CDF von .XXXE(X)&lt;∞E(X)&lt;∞\mathbb{E}(X)<\inftyεF−1(1−ε)→0εF−1(1−ε)→0\varepsilon F^{-1}(1-\varepsilon) \to 0ε→0+ε→0+\varepsilon\to 0^+FFFXXX Dies ist geometrisch leicht zu erkennen, wenn die Gleichheit …


6
Quartile in Excel
Ich interessiere mich für die Definition von Quartil, die normalerweise verwendet wird, wenn Sie in grundlegenden Statistiken sind. Ich habe ein Buch vom Typ Stat 101 und es gibt nur eine intuitive Definition. "Ungefähr ein Viertel der Daten fällt auf oder unter das erste Quartil ..." Es gibt jedoch ein …
10 excel  quantiles 

4
Warum bedeutet die Tatsache, dass 1 Median niedriger als ein anderer Median ist, nicht, dass die meisten in Gruppe 1 kleiner sind als die meisten in Gruppe 2?
Ich glaubte, dass die folgenden Boxplots als "die meisten Männer sind schneller als die meisten Frauen" (in diesem Datensatz) interpretiert werden könnten, hauptsächlich weil die mittlere Männerzeit niedriger war als die mittlere Frauenzeit. Aber der EdX-Kurs zu R und Statistik- Quiz hat mir gesagt, dass das falsch ist. Bitte helfen …


1
Asymptotische Normalität der Ordnungsstatistik von Schwerschwanzverteilungen
Hintergrund: Ich habe ein Beispiel, das ich mit einer starken Schwanzverteilung modellieren möchte. Ich habe einige Extremwerte, so dass die Verbreitung der Beobachtungen relativ groß ist. Meine Idee war es, dies mit einer verallgemeinerten Pareto-Verteilung zu modellieren, und das habe ich auch getan. Jetzt ist das 0,975-Quantil meiner empirischen Daten …



Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.