Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren

29
Beispiele für den Unterricht: Korrelation bedeutet nicht Kausalität
Es gibt ein altes Sprichwort: "Korrelation bedeutet nicht Verursachung". Wenn ich unterrichte, neige ich dazu, die folgenden Standardbeispiele zu verwenden, um diesen Punkt zu veranschaulichen: Störchenzahl und Geburtenrate in Dänemark; Anzahl der Priester in Amerika und Alkoholismus; Zu Beginn des 20. Jahrhunderts wurde festgestellt, dass eine starke Korrelation zwischen der …

5
Was ist Regularisierung im Klartext?
Im Gegensatz zu anderen Artikeln fand ich den Wikipedia- Eintrag für dieses Thema für einen Nicht-Mathematiker (wie mich) nicht lesbar. Ich habe die Grundidee verstanden, dass Sie Modelle mit weniger Regeln bevorzugen. Was ich nicht verstehe, ist, wie man von einem Regelwerk zu einem "Regularisierungs-Score" gelangt, anhand dessen man die …



4
Ein Psychologiejournal verbot p-Werte und Konfidenzintervalle; ist es in der Tat ratsam, sie nicht mehr zu verwenden?
Am 25. Februar 2015 hat die Zeitschrift Basic and Applied Social Psychology einen Leitartikel herausgegeben , der Werte und Konfidenzintervalle aus allen zukünftigen Veröffentlichungen verbietet .ppp Konkret heißt es (Formatierung und Hervorhebung gehören mir): [...] vor der Veröffentlichung müssen die Autoren alle Überreste des NHSTP ( Werte, t- Werte, F- …

3
Was ist „eingeschränkte maximale Wahrscheinlichkeit“ und wann sollte es angewendet werden?
Ich habe in der Zusammenfassung dieses Papiers gelesen, dass: "Das Maximum Likelihood (ML) -Verfahren von Hartley aud Rao wird durch Anpassen einer Transformation von Patterson und Thompson modifiziert, bei der die Wahrscheinlichkeitsrendernormalität in zwei Teile aufgeteilt wird, von denen einer frei von festen Effekten ist. Die Maximierung dieses Teils ergibt …

6
Modell zur Vorhersage der Anzahl der Youtube-Aufrufe von Gangnam Style
PSYs Musikvideo "Gangnam Style" ist beliebt, nach etwas mehr als 2 Monaten hat es etwa 540 Millionen Zuschauer. Ich habe das letzte Woche von meinen jugendlichen Kindern beim Abendessen erfahren und bald ging die Diskussion dahin, ob es möglich ist, eine Art Vorhersage darüber zu treffen, wie viele Zuschauer es …
73 modeling  web 


2
Resampling- / Simulationsmethoden: Monte Carlo, Bootstrapping, Jackknifing, Kreuzvalidierung, Randomisierungstests und Permutationstests
Ich versuche den Unterschied zwischen verschiedenen Resampling-Methoden (Monte-Carlo-Simulation, parametrisches Bootstrapping, nicht-parametrisches Bootstrapping, Jackknifing, Kreuzvalidierung, Randomisierungstests und Permutationstests) und deren Implementierung in meinem eigenen Kontext mithilfe von R zu verstehen. Angenommen, ich habe die folgende Situation: Ich möchte eine ANOVA mit einer Y- Variablen ( Yvar) und einer X- Variablen ( …



6
Auswählen einer Clustering-Methode
Wenn Sie die Clusteranalyse für einen Datensatz verwenden, um ähnliche Fälle zu gruppieren, müssen Sie aus einer Vielzahl von Clustermethoden und Entfernungsmaßen auswählen. Manchmal kann eine Wahl die andere beeinflussen, aber es gibt viele mögliche Kombinationen von Methoden. Hat jemand irgendwelche Empfehlungen, wie man unter den verschiedenen Clustering-Algorithmen / Methoden …


6
Gibt es einen guten Grund, PCA anstelle von EFA zu verwenden? Kann PCA auch ein Ersatz für die Faktoranalyse sein?
In einigen Disziplinen wird PCA (Principal Component Analysis) systematisch und ohne Begründung verwendet, und PCA und EFA (Exploratory Factor Analysis) werden als Synonyme betrachtet. Ich habe daher kürzlich PCA verwendet, um die Ergebnisse einer Skalenvalidierungsstudie zu analysieren (21 Punkte auf einer 7-Punkte-Likert-Skala, die 3 Faktoren zu je 7 Punkten enthalten …


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.