Als «terminology» getaggte Fragen

Verwendung und Bedeutung bestimmter technischer Wörter / Konzepte in der Statistik.

2
"Blindvariable" versus "Indikatorvariable" für nominale / kategoriale Daten
"Dummy-Variable" und "Indikatorvariable" sind häufig verwendete Bezeichnungen zur Beschreibung der Zugehörigkeit zu einer Kategorie mit 0/1 Kodierung. in der Regel 0: kein Mitglied der Kategorie, 1: Mitglied der Kategorie. Am 26.11.2014 ergab eine schnelle Suche auf scholar.google.com (mit Anführungszeichen), dass in ungefähr 318.000 Artikeln "Dummy-Variable" und in ungefähr 112.000 Artikeln …

1
Thesaurus für Statistik und Maschinelles Lernen
Gibt es einen Referenzthesaurus für Statistiken und Begriffe des maschinellen Lernens? Ich weiß, dass Wikipedia-Artikel häufig Synonyme enthalten, aber ich hätte gerne einen bloßen Thesaurus, den ich einfach durchgehen könnte (im Gegensatz zu einer vollständigen Enzyklopädie), um sicherzustellen, dass ich den gesamten Jargon kenne.

1
Unterschied zwischen Randomisierungstest und Permutationstest
In der Literatur werden die Begriffe Randomisierung und Permutation synonym verwendet. Bei vielen Autoren, die "Permutationstests (auch als Randomisierungstests bezeichnet)" oder umgekehrt angeben. Bestenfalls glaube ich, dass der Unterschied subtil ist und in ihren Annahmen über die Daten und möglichen Schlussfolgerungen liegt, die gezogen werden können. Ich muss nur überprüfen, …

5
Unterschied zwischen den Begriffen "gemeinsame Verteilung" und "multivariate Verteilung"?
Ich schreibe über die Verwendung einer "gemeinsamen Wahrscheinlichkeitsverteilung" für ein Publikum, das mit größerer Wahrscheinlichkeit die "multivariate Verteilung" verstehen würde, und überlege daher, die spätere zu verwenden. Dabei möchte ich aber nicht den Sinn verlieren. Wikipedia scheint darauf hinzuweisen, dass es sich um Synonyme handelt. Sind sie? Wenn nein, warum …


2
Was ist Bayes Error beim maschinellen Lernen?
http://www.deeplearningbook.org/contents/ml.html In diesem Abschnitt wird der Bayes-Fehler wie folgt erläutert Das ideale Modell ist ein Orakel, das einfach die wahre Wahrscheinlichkeitsverteilung kennt, die die Daten erzeugt. Sogar ein solches Modell wird bei vielen Problemen immer noch Fehler verursachen, da möglicherweise immer noch Rauschen in der Verteilung vorhanden ist. Im Fall …

1
Welche Mehrfachvergleichsmethode kann für ein älteres Modell verwendet werden: lsmeans oder glht?
Ich analysiere einen Datensatz unter Verwendung eines gemischten Effektmodells mit einem festen Effekt (Bedingung) und zwei zufälligen Effekten (Teilnehmer aufgrund des innerhalb des Motivs und des Paares). Das Modell wurde mit dem erzeugten lme4Paket: exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp). Als nächstes führte ich einen Likelihood-Ratio-Test dieses Modells gegen das Modell ohne festen Effekt (Bedingung) …

2
Macht Wolfram Mathworld einen Fehler bei der Beschreibung einer diskreten Wahrscheinlichkeitsverteilung mit einer Wahrscheinlichkeitsdichtefunktion?
In der Regel wird eine Wahrscheinlichkeitsverteilung über diskrete Variablen mit einer Wahrscheinlichkeitsmassenfunktion (PMF) beschrieben: Bei der Arbeit mit kontinuierlichen Zufallsvariablen beschreiben wir Wahrscheinlichkeitsverteilungen mit einer Wahrscheinlichkeitsdichtefunktion (PDF) anstelle einer Wahrscheinlichkeitsmassenfunktion. - Deep Learning von Goodfellow, Bengio und Courville Allerdings Wolfram Mathworld ist PDF mit der Wahrscheinlichkeitsverteilung über diskrete Variablen zu …



3
Definition der Familie einer Distribution?
Hat eine Familie einer Distribution eine andere Definition für Statistik als in anderen Disziplinen? Im Allgemeinen ist eine Kurvenfamilie ein Satz von Kurven, von denen jede durch eine Funktion oder Parametrisierung gegeben ist, in der einer oder mehrere der Parameter variiert werden. Solche Familien werden beispielsweise zur Charakterisierung von elektronischen …




1
Wie ist der „Fundamentalsatz der Faktoranalyse“ auf PCA anwendbar, oder wie sind PCA-Ladungen definiert?
Ich bin gerade dabei, ein Dia-Set für die "Faktoranalyse" zu durchlaufen (PCA, soweit ich das beurteilen kann). Darin wird der "Fundamentalsatz der Faktoranalyse" abgeleitet, der besagt, dass die Korrelationsmatrix der in die Analyse Daten ( ) unter Verwendung der Matrix der Faktorladungen ( ) wiederhergestellt werden kann :RR\bf RAA\bf A …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.