Als «rule-of-thumb» getaggte Fragen

Ratschläge zu statistischen Analysen, die in der Praxis häufig nützlich sind (deren Funktionsfähigkeit jedoch nicht immer garantiert ist).

24
Faustregeln für „moderne“ Statistiken
Ich mag G van Belles Buch über statistische Faustregeln und in geringerem Maße allgemeine Fehler in der Statistik (und wie man sie vermeidet) von Phillip I Good und James W. Hardin. Sie adressieren häufige Fallstricke bei der Interpretation von Ergebnissen aus experimentellen Studien und Beobachtungsstudien und geben praktische Empfehlungen für …

8
Berechnung der optimalen Anzahl von Behältern in einem Histogramm
Ich bin daran interessiert, eine möglichst optimale Methode zu finden, um zu bestimmen, wie viele Fächer ich in einem Histogramm verwenden soll. Meine Daten sollten höchstens 30 bis 350 Objekte umfassen. Insbesondere versuche ich, Schwellenwerte (wie Otsus Methode) anzuwenden, von denen "gute" Objekte, von denen ich weniger haben sollte und …


4
Welche Referenzen sollten angeführt werden, um die Verwendung von 30 als ausreichend große Stichprobe zu unterstützen?
Ich habe viele Male gelesen / gehört, dass die Stichprobengröße von mindestens 30 Einheiten als "große Stichprobe" angesehen wird (Normalitätsannahmen der Mittelwerte gelten normalerweise ungefähr aufgrund der CLT, ...). Daher generiere ich in meinen Experimenten normalerweise Proben von 30 Einheiten. Können Sie mir bitte einen Hinweis geben, der bei der …

2
Gute Online-Ressource mit Tipps zur grafischen Zuordnung zwischen zwei numerischen Variablen unter verschiedenen Bedingungen
Kontext: Im Laufe der Zeit habe ich eine Reihe von Heuristiken zur effektiven Darstellung der Assoziation zwischen zwei numerischen Variablen entwickelt. Ich stelle mir vor, dass die meisten Leute, die mit Daten arbeiten, ähnliche Regeln haben würden. Beispiele für solche Regeln könnten sein: Wenn eine der Variablen positiv verzerrt ist, …

4
Wie projiziert man einen neuen Vektor auf den PCA-Raum?
Nach der Durchführung der Hauptkomponentenanalyse (PCA) möchte ich einen neuen Vektor auf den PCA-Raum projizieren (dh seine Koordinaten im PCA-Koordinatensystem finden). Ich habe PCA in R-Sprache mit berechnet prcomp. Jetzt sollte ich meinen Vektor mit der PCA-Rotationsmatrix multiplizieren können. Sollen die Hauptkomponenten in dieser Matrix in Zeilen oder Spalten angeordnet …
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

3
oderMetriken für Clustering?
Verwendet jemand die Metriken L1L1L_1 oder L.5L.5L_.5 für das Clustering und nicht L2L2L_2 ? Über das überraschende Verhalten von Distanzmetriken im hochdimensionalen Raum gaben Aggarwal et al. (2001) an, dass L1L1L_1 istfür hochdimensionale Data-Mining-Anwendungendurchweg vorzuziehen als die euklidische Distanzmetrik L2L2L_2 und behauptete, dass oder noch besser kann.L.5L.5L_.5L.1L.1L_.1 Gründe für die …


1
Die Stichprobengröße ist erforderlich, um zu bestimmen, welche Anzeige die höchste Klickrate aufweist
Ich bin von Beruf Software-Designer und arbeite an einem Projekt für einen Kunden. Ich möchte sicherstellen, dass meine Analyse statistisch fundiert ist. Beachten Sie Folgendes: Wir haben n Anzeigen (n <10) und möchten einfach wissen, welche Anzeige die beste Leistung erbringt. Unser Ad-Server wird zufällig eine dieser Anzeigen schalten. Erfolg …




1
Wie formalisiert man eine vorherige Wahrscheinlichkeitsverteilung? Gibt es Faustregeln oder Tipps, die man verwenden sollte?
Während ich gerne denke, dass ich das Konzept der Vorinformationen in der statistischen Analyse und Entscheidungsfindung von Bayes gut verstehe, habe ich oft Probleme, mich mit seiner Anwendung zu befassen. Ich denke an einige Situationen, die meine Kämpfe veranschaulichen, und ich habe das Gefühl, dass sie in den Bayes'schen statistischen …

1
Optimale Anzahl von Behältern im Histogramm nach der Freedman-Diaconis-Regel: Differenz zwischen theoretischer Rate und tatsächlicher Anzahl
Wikipedia berichtet, dass nach der Freedman- und Diaconis-Regel die optimale Anzahl von Behältern in einem Histogramm wachsen solltekkk k ∼ n1 / 3k∼n1/3k\sim n^{1/3} Dabei ist die Stichprobengröße.nnn Wenn Sie sich jedoch die nclass.FDFunktion in R ansehen , die diese Regel implementiert, zumindest mit Gaußschen Daten, und wenn , scheint …

1
Grundlegende einfache Regeln für Statistiken
Wenn wir in einem Binomialversuch positives Individuum unter Individuen beobachten, ist der Anteil positiver Individuen signifikant niedriger als mit einem Typ-1-Fehler von weniger als und sehr nahe bei . Diese Tatsache, die manchmal als "Dreierregel" bezeichnet wird, ist eine Folge der Ungleichungenx=0x=0x=0nnn3/n3/n3/n5%5%5\%exp(−np1−p)≤Pr(X=0)≤exp(−np).exp⁡(−np1−p)≤Pr(X=0)≤exp⁡(−np).\exp\left(-\frac{np}{1-p}\right) \leq \Pr(X=0) \leq \exp(-np). Kennen Sie andere einfache …
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.