Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren



8
Ist Stichproben in Zeiten von Big Data relevant?
Oder eher "wird es sein"? Big Data macht Statistiken und relevantes Wissen umso wichtiger, scheint aber die Stichprobentheorie zu unterschätzen. Ich habe diesen Hype um 'Big Data' gesehen und frage mich, warum ich alles analysieren möchte . Gab es nicht einen Grund, warum "Sampling Theory" entworfen / implementiert / erfunden …

10
Wie bestimme ich die richtige Anzahl von Clustern?
Wir finden die Cluster-Zentren und weisen k verschiedenen Cluster-Klassen Punkte zu. Dies ist ein sehr bekannter Algorithmus, der fast in jedem maschinellen Lernpaket im Netz zu finden ist. Aber der fehlende und wichtigste Teil meiner Meinung nach ist die Wahl eines korrekten k. Was ist der beste Wert dafür? Und …



6
Einführung in die Statistik für Mathematiker
Was ist eine gute Einführung in die Statistik für einen Mathematiker, der sich mit Wahrscheinlichkeiten bereits auskennt? Ich habe zwei unterschiedliche Gründe zu fragen, die durchaus zu unterschiedlichen Vorschlägen führen können: Ich möchte die statistische Motivation hinter vielen Problemen, die von Probabilisten betrachtet werden, besser verstehen. Ich möchte wissen, wie …
54 references 

5
Ist es eine gute Idee, die p-Werte in einer multiplen Regression für multiple Vergleiche anzupassen?
Nehmen wir an, Sie sind ein sozialwissenschaftlicher Forscher / Ökonometriker, der versucht, relevante Prädiktoren für die Nachfrage nach einer Dienstleistung zu finden. Sie haben 2 ergebnis- / abhängige Variablen, die den Bedarf beschreiben (unter Verwendung des Dienstes yes / no und der Anzahl der Fälle). Sie haben 10 Prädiktor- / …


19
Mathematische Statistik Videos
Eine Frage suchte zuvor nach Empfehlungen für Lehrbücher zur mathematischen Statistik Kennt jemand eine gute Online- Videovorlesung über mathematische Statistik ? Die nächsten, die ich gefunden habe, sind: Maschinelles lernen Ökonometrie UPDATE: Bei einigen der unten aufgeführten Vorschläge handelt es sich um gute Videos vom Typ Statistik 101. Ich frage …


5
Was ist eine intuitive Erklärung dafür, wie sich PCA von einem geometrischen Problem (mit Abständen) zu einem linearen Algebraproblem (mit Eigenvektoren) entwickelt?
Ich habe viel über PCA gelesen, einschließlich verschiedener Tutorials und Fragen (wie diese , diese , diese und diese ). Das geometrische Problem, das PCA zu optimieren versucht, ist mir klar: PCA versucht, die erste Hauptkomponente durch Minimierung des Rekonstruktionsfehlers (Projektionsfehlers) zu finden, wodurch gleichzeitig die Varianz der projizierten Daten …

10
Hold-out-Validierung vs. Cross-Validierung
Mir scheint, dass eine Hold-out-Validierung nutzlos ist. Das heißt, die Aufteilung des Originaldatensatzes in zwei Teile (Training und Testen) und die Verwendung der Testergebnisse als Verallgemeinerungsmaßnahme ist etwas nutzlos. Die K-fache Kreuzvalidierung scheint bessere Annäherungen an die Generalisierung zu liefern (da sie in jedem Punkt trainiert und testet). Warum sollten …

4
Kovarianz und Unabhängigkeit?
Ich habe aus meinem Lehrbuch gelesen, dass nicht garantiert, dass X und Y unabhängig sind. Aber wenn sie unabhängig sind, muss ihre Kovarianz 0 sein. Ich konnte mir noch kein richtiges Beispiel vorstellen; könnte jemand eine besorgen?cov(X,Y)=0cov(X,Y)=0\text{cov}(X,Y)=0


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.