Als «computational-statistics» getaggte Fragen

Bezieht sich auf die Schnittstelle von Statistik und Computer; die Verwendung von Algorithmen und Software für statistische Zwecke.

1
Algebraische Klassifikatoren, weitere Informationen?
Ich habe algebraische Klassifikatoren gelesen : einen generischen Ansatz für schnelle Kreuzvalidierung, Online-Training und paralleles Training und war von der Leistung der abgeleiteten Algorithmen begeistert. Es scheint jedoch, dass es jenseits von Naive Bayes (und GBMs) nicht viele Algorithmen gibt, die an das Framework angepasst sind. Gibt es andere Papiere, …

2
Wie wird aus der diskreten Verteilung auf die nicht negativen ganzen Zahlen abgetastet?
Ich habe die folgende diskrete Verteilung, wobei bekannte Konstanten sind:α , βα,β\alpha,\beta p ( x ; α , β) = Beta ( α + 1 , β+ x )Beta ( α , β)für x = 0 , 1 , 2 , …p(x;α,β)=Beta(α+1,β+x)Beta(α,β)for x=0,1,2,… p(x;\alpha,\beta) = \frac{\text{Beta}(\alpha+1, \beta+x)}{\text{Beta}(\alpha,\beta)} \;\;\;\;\text{for } x …



2
Wie finde ich optimale Werte für die Abstimmungsparameter beim Boosten von Bäumen?
Mir ist klar, dass das Boosting-Tree-Modell 3 Tuning-Parameter enthält, d. H. die Anzahl der Bäume (Anzahl der Iterationen) Schrumpfungsparameter Anzahl der Teilungen (Größe der einzelnen Bäume) Meine Frage ist: Wie soll ich für jeden der Abstimmungsparameter den optimalen Wert finden? Und welche Methode? Beachten Sie Folgendes: Der Parameter für die …




2
Wie kann man zwei Algorithmen in drei Datensätzen bei der Auswahl und Klassifizierung von Features statistisch vergleichen?
Problemhintergrund: Im Rahmen meiner Forschung habe ich zwei Algorithmen geschrieben, mit denen eine Reihe von Merkmalen aus einem Datensatz ausgewählt werden können (Genexpressionsdaten von Krebspatienten). Diese Merkmale werden dann getestet, um festzustellen, wie gut sie eine unsichtbare Probe entweder als Krebs oder als Nichtkrebs klassifizieren können. Für jeden Lauf des …

2
Bootstrap vs numerische Integration
Mein Verständnis des Bootstrap-Ansatzes basiert auf Wassermans Framework (fast wörtlich): Sei eine Statistik ( ist die aus der Verteilung gezogene iid-Stichprobe ). Angenommen , wir schätzen möchten - die Varianz der gegeben .X i F V F ( T n ) T n FT.n= g( X.1, . . . , …

1
Symbolische Computeralgebra für Statistiken
Welche Funktionen sollten in einem CAS vorhanden sein , der speziell auf Statistik ausgerichtet ist? Symbolische Algebra-Systeme wie Mathematica und Maple werden häufig für Kalkül-, Logik- und Physikprobleme verwendet, jedoch nur selten für Statistiken. Warum ist das? Welche statistischen Konstrukte könnten einem symbolischen Algebra-System hinzugefügt werden, um seine Verwendung in …

1
Unterschied zwischen "Computerstatistik" und "Statistisches Rechnen"?
Aus dem Handbuch der Computerstatistik von Gentle et al . Wir verwenden den Begriff "statistisches Rechnen" , um die Berechnungsmethoden zu bezeichnen, die statistische Methoden ermöglichen. Das statistische Rechnen umfasst numerische Analysen, Datenbankmethoden, Computergrafiken, Software-Engineering und die Schnittstelle zwischen Computer und Mensch. Wir verwenden den Begriff „Computerstatistik“ etwas weiter gefasst, …
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.