Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren

1
Wie erreicht ein einfaches logistisches Regressionsmodell eine Klassifizierungsgenauigkeit von 92% für MNIST?
Obwohl alle Bilder im MNIST-Datensatz in einem ähnlichen Maßstab zentriert und ohne Rotation sichtbar sind, weisen sie eine signifikante Variation der Handschrift auf, die mich verblüfft, wie ein lineares Modell eine so hohe Klassifizierungsgenauigkeit erzielt. Soweit ich in der Lage bin, angesichts der signifikanten Variation der Handschrift zu visualisieren, sollten …



10
Taleb und der Schwarze Schwan
Talebs Buch "The Black Swan" war ein Bestseller der New York Times, als es vor einigen Jahren herauskam. Das Buch ist jetzt in der zweiten Auflage. Nach einem Treffen mit Statistikern auf einer JSM (einer jährlichen statistischen Konferenz) hat Taleb seine Kritik an der Statistik etwas abgeschwächt. Der Kern des …





3
Was ist der Unterschied zwischen einem neuronalen Netzwerk und einem Deep-Believe-Netzwerk?
Ich habe den Eindruck, dass, wenn man sich auf ein "Deep Believe" -Netzwerk bezieht, dies im Grunde genommen ein neuronales Netzwerk ist, aber sehr groß. Ist das richtig oder impliziert ein tiefes Glaubensnetzwerk auch, dass der Algorithmus selbst anders ist (dh kein vorwärtskoppelndes neuronales Netz, aber vielleicht etwas mit Rückkopplungsschleifen)?

6
Warum verwendet der k-means Clustering-Algorithmus nur die euklidische Distanzmetrik?
Gibt es einen bestimmten Zweck in Bezug auf Effizienz oder Funktionalität, warum der k-means-Algorithmus zum Beispiel keine Cosinus- (Dis-) Ähnlichkeit als Distanzmetrik verwendet, sondern nur die euklidische Norm verwenden kann? Wird die K-means-Methode im Allgemeinen eingehalten und korrekt sein, wenn andere Abstände als Euklidisch berücksichtigt oder verwendet werden? [Ergänzung von …

3
Wie kann man einen Beispielbaum aus randomForest :: getTree () zeichnen? [geschlossen]
Jeder hat Bibliotheks- oder Codevorschläge, wie man tatsächlich ein paar Beispielbäume plottet : getTree(rfobj, k, labelVar=TRUE) (Ja, ich weiß, Sie sollten dies nicht operativ tun, RF ist eine Blackbox usw. usw. Ich möchte einen Baum visuell auf Fehler überprüfen, um festzustellen, ob sich Variablen nicht intuitiv verhalten Wie gut funktionieren …

4
Annahmen bezüglich Bootstrap-Schätzungen der Unsicherheit
Ich schätze die Nützlichkeit des Bootstraps bei der Ermittlung von Unsicherheitsschätzungen, aber eine Sache, die mich immer gestört hat, ist, dass die Verteilung, die diesen Schätzungen entspricht, die von der Stichprobe definierte Verteilung ist. Im Allgemeinen scheint es eine schlechte Idee zu sein, zu glauben, dass unsere Stichprobenhäufigkeiten genau der …


8
Bayesianer: Sklaven der Wahrscheinlichkeitsfunktion?
In seinem Buch "All of Statistics" präsentiert Prof. Larry Wasserman das folgende Beispiel (11.10, Seite 188). Angenommen, wir haben eine Dichte , so daß , wobei ein bekannter (nicht - negativ, integrierbare) -Funktion, und die Normierungskonstante ist unbekannt .ffff(x)=cg(x)f(x)=cg(x)f(x)=c\,g(x)c > 0gggc>0c>0c>0 Wir interessieren uns für die Fälle, in denen wir …


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.