Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren



3
Naive Bayes verstehen
Von StatSoft, Inc. (2013), Electronic Statistics Textbook , "Naive Bayes Classifier" : Betrachten Sie das in der obigen Abbildung gezeigte Beispiel, um das Konzept der Naive Bayes-Klassifizierung zu veranschaulichen. Wie angegeben, können die Objekte als GRÜN oder ROT klassifiziert werden. Meine Aufgabe ist es, neue Fälle bei ihrem Eintreffen zu …


5
Wenn der t-Test und die ANOVA für zwei Gruppen gleich sind, warum sind ihre Annahmen nicht gleich?
Ich bin mir sicher, dass ich das komplett um meinen Kopf gewickelt habe, aber ich kann es einfach nicht herausfinden. Der t-Test vergleicht zwei Normalverteilungen mit der Z-Verteilung. Aus diesem Grund wird bei den DATEN von Normalität ausgegangen. ANOVA entspricht einer linearen Regression mit Dummy-Variablen und verwendet wie OLS Quadratsummen. …

4
Warum minimieren wir die negative Wahrscheinlichkeit, wenn sie der Maximierung der Wahrscheinlichkeit entspricht?
Diese Frage hat mich lange Zeit verwirrt. Ich verstehe die Verwendung von "log" zur Maximierung der Wahrscheinlichkeit, daher frage ich nicht nach "log". Meine Frage ist, warum wir diese NLL erfunden haben, da die Maximierung der Protokollwahrscheinlichkeit der Minimierung der "negativen Protokollwahrscheinlichkeit" (NLL) entspricht. Warum nutzen wir die "positive Wahrscheinlichkeit" …

2
Warum verwenden Convolutional Neural Networks keine Support Vector Machine zur Klassifizierung?
In den letzten Jahren sind Convolutional Neural Networks (CNNs) zum Stand der Technik für die Objekterkennung in der Computersicht geworden. Typischerweise besteht ein CNN aus mehreren Faltungsschichten, gefolgt von zwei vollständig verbundenen Schichten. Eine Intuition dahinter ist, dass die Faltungsschichten eine bessere Darstellung der Eingabedaten lernen und die vollständig verbundenen …

6
Sind Residuen "vorhergesagt minus tatsächlich" oder "tatsächlich minus vorhergesagt"?
Ich habe gesehen, dass "Residuen" unterschiedlich definiert sind als "vorhergesagte minus tatsächliche Werte" oder "tatsächliche minus vorausgesagte Werte". Um zu veranschaulichen, dass beide Formeln weit verbreitet sind, vergleichen Sie die folgenden Websuchen: Rest "vorhergesagt minus tatsächlich" Rest "Ist minus vorhergesagt" In der Praxis macht es fast keinen Unterschied, da das …

2
Warum neigt das Testen von Frequentist-Hypothesen dazu, die Nullhypothese bei ausreichend großen Stichproben abzulehnen?
Ich habe gerade diesen Artikel über den Bayes-Faktor gelesen, als ich auf diese Passage gestoßen bin Das Testen von Hypothesen mit Bayes-Faktoren ist robuster als das Testen von häufig auftretenden Hypothesen, da die Bayes-Form eine Verzerrung der Modellauswahl vermeidet, Belege zugunsten der Nullhypothese auswertet, Modellunsicherheit einschließt und das Vergleichen von …


2
Was sagt die Inverse der Kovarianzmatrix über Daten aus? (Intuitiv)
Ich bin neugierig auf die Natur von . Kann jemand etwas intuitives über "Was sagt Σ - 1 über Daten?"Σ−1Σ−1\Sigma^{-1}Σ−1Σ−1\Sigma^{-1} Bearbeiten: Danke für die Antworten Nach einigen großartigen Kursen möchte ich einige Punkte hinzufügen: Es ist ein Maß für Information, dh ist eine Informationsmenge entlang der Richtung x .xTΣ−1xxTΣ−1xx^T\Sigma^{-1}xxxx Dualität: …



3
Lineares Modell mit logarithmisch transformierter Antwort vs. verallgemeinertes lineares Modell mit logarithmischer Verknüpfung
In diesem Artikel mit dem Titel "AUSWAHL VON GENERALISIERTEN LINEAREN MODELLEN FÜR MEDIZINISCHE DATEN" schreiben die Autoren: In einem verallgemeinerten linearen Modell wird der Mittelwert durch die Verknüpfungsfunktion transformiert, anstatt die Antwort selbst zu transformieren. Die beiden Transformationsmethoden können zu sehr unterschiedlichen Ergebnissen führen. Beispielsweise ist der Mittelwert der logarithmisch …

3
Was ist die Intuition hinter bedingten Gaußschen Verteilungen?
Angenommen, . Dann ist die bedingte Verteilung von unter der Voraussetzung , dass multivariate Normalverteilung mit dem Mittelwert:X∼N2(μ,Σ)X∼N2(μ,Σ)\mathbf{X} \sim N_{2}(\mathbf{\mu}, \mathbf{\Sigma})X1X1X_1X2=x2X2=x2X_2 = x_2 E[P(X1|X2=x2)]=μ1+σ12σ22(x2−μ2)E[P(X1|X2=x2)]=μ1+σ12σ22(x2−μ2) E[P(X_1 | X_2 = x_2)] = \mu_1+\frac{\sigma_{12}}{\sigma_{22}}(x_2-\mu_2) und Varianz:Var[P(X1|X2=x2)]=σ11−σ212σ22Var[P(X1|X2=x2)]=σ11−σ122σ22{\rm Var}[P(X_1 | X_2 = x_2)] = \sigma_{11}-\frac{\sigma_{12}^{2}}{\sigma_{22}} Es ist sinnvoll, dass die Varianz abnimmt, da wir mehr …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.