Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren


7
So wählen Sie zwischen t-Test und nicht parametrischem Test, z. B. Wilcoxon, in kleinen Stichproben
Bestimmte Hypothesen können mit dem Student- t- Test (möglicherweise mit der Welch-Korrektur für ungleiche Varianzen bei zwei Stichproben) oder mit einem nichtparametrischen Test wie dem Wilcoxon-Paired-Signed-Rank-Test, dem Wilcoxon-Mann-Whitney-U-Test, getestet werden. oder der Paired-Sign-Test. Wie können wir prinzipiell entscheiden, welcher Test am besten geeignet ist, insbesondere wenn die Stichprobengröße "klein" ist? …


6
Ist es möglich, ein neuronales Netzwerk ohne Backpropagation zu trainieren?
Viele Bücher und Tutorials zu neuronalen Netzen verbringen viel Zeit mit dem Backpropagation-Algorithmus, der im Wesentlichen ein Werkzeug zur Berechnung des Gradienten darstellt. Nehmen wir an, wir bauen ein Modell mit ~ 10K Parametern / Gewichten. Ist es möglich, die Optimierung mit einigen gradientenfreien Optimierungsalgorithmen durchzuführen? Ich denke, die Berechnung …


2
Wie viel wissen wir über P-Hacking in freier Wildbahn?
Der Ausdruck p- Hacking (auch: " Datenbaggern " , "Schnüffeln" oder "Fischen") bezieht sich auf verschiedene Arten statistischer Verfehlungen, bei denen Ergebnisse künstlich statistisch signifikant werden. Es gibt viele Möglichkeiten, ein "signifikanteres" Ergebnis zu erzielen, unter anderem: nur Analysieren einer "interessanten" Teilmenge der Daten , in denen ein Muster gefunden …




6
Tests zur Überprüfung grundlegender Daten
In meiner beruflichen Tätigkeit arbeite ich oft mit Datensätzen anderer Personen, Nicht-Experten bringen mir klinische Daten und ich helfe ihnen, diese zusammenzufassen und statistische Tests durchzuführen. Das Problem, das ich habe, ist, dass die Datensätze, die ich mitbringe, fast immer mit Tippfehlern, Inkonsistenzen und allen möglichen anderen Problemen durchsetzt sind. …

3
Wie berechnen Sie die Genauigkeit und den Rückruf für die Klassifizierung mehrerer Klassen mithilfe der Verwirrungsmatrix?
Ich frage mich, wie man die Präzision berechnet und eine Verwirrungsmatrix für ein Klassifizierungsproblem mit mehreren Klassen verwendet. Insbesondere kann eine Beobachtung nur ihrer wahrscheinlichsten Klasse / Kennzeichnung zugeordnet werden. Ich würde gerne berechnen: Präzision = TP / (TP + FP) Rückruf = TP / (TP + FN) für jede …

10
Warum muss eine Zeitreihe stationär sein?
Ich verstehe, dass eine stationäre Zeitreihe eine ist, deren Mittelwert und Varianz über die Zeit konstant ist. Kann jemand bitte erklären, warum wir sicherstellen müssen, dass unser Datensatz stationär ist, bevor wir verschiedene ARIMA- oder ARM-Modelle darauf ausführen können? Gilt dies auch für normale Regressionsmodelle, bei denen Autokorrelation und / …

12
Wer sind die Bayesianer?
Wenn man sich für Statistik interessiert, wird die Dichotomie "Frequentist" vs. "Bayesian" bald alltäglich (und wer hat Nate Silvers " Das Signal und das Rauschen " überhaupt nicht gelesen ?). In Vorträgen und Einführungskursen ist die Sichtweise überwiegend häufig ( MLE- , Werte), aber es bleibt in der Regel nur …



Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.