Statistiken und Big Data

4

Differenz zwischen Standardfehler und Standardabweichung

Ich habe Mühe, den Unterschied zwischen dem Standardfehler und der Standardabweichung zu verstehen. Wie unterscheiden sie sich und warum müssen Sie den Standardfehler messen?

96 mean standard-deviation standard-error intuition

7

So wählen Sie zwischen t-Test und nicht parametrischem Test, z. B. Wilcoxon, in kleinen Stichproben

Bestimmte Hypothesen können mit dem Student- t- Test (möglicherweise mit der Welch-Korrektur für ungleiche Varianzen bei zwei Stichproben) oder mit einem nichtparametrischen Test wie dem Wilcoxon-Paired-Signed-Rank-Test, dem Wilcoxon-Mann-Whitney-U-Test, getestet werden. oder der Paired-Sign-Test. Wie können wir prinzipiell entscheiden, welcher Test am besten geeignet ist, insbesondere wenn die Stichprobengröße "klein" ist? …

96 hypothesis-testing t-test nonparametric small-sample wilcoxon-mann-whitney

4

Wie wähle ich den Kernel für SVM aus?

Wenn Sie SVM verwenden, müssen Sie einen Kernel auswählen. Ich frage mich, wie ich einen Kernel auswählen soll. Irgendwelche Kriterien für die Kernelauswahl?

95 machine-learning svm kernel-trick

6

Ist es möglich, ein neuronales Netzwerk ohne Backpropagation zu trainieren?

Viele Bücher und Tutorials zu neuronalen Netzen verbringen viel Zeit mit dem Backpropagation-Algorithmus, der im Wesentlichen ein Werkzeug zur Berechnung des Gradienten darstellt. Nehmen wir an, wir bauen ein Modell mit ~ 10K Parametern / Gewichten. Ist es möglich, die Optimierung mit einigen gradientenfreien Optimierungsalgorithmen durchzuführen? Ich denke, die Berechnung …

94 machine-learning neural-networks optimization backpropagation

3

Unterschied zwischen neuronalem Nettogewichtsabfall und Lernrate

Was ist im Zusammenhang mit neuronalen Netzen der Unterschied zwischen Lernrate und Gewichtsabnahme?

94 neural-networks terminology

2

Wie viel wissen wir über P-Hacking in freier Wildbahn?

Der Ausdruck p- Hacking (auch: " Datenbaggern " , "Schnüffeln" oder "Fischen") bezieht sich auf verschiedene Arten statistischer Verfehlungen, bei denen Ergebnisse künstlich statistisch signifikant werden. Es gibt viele Möglichkeiten, ein "signifikanteres" Ergebnis zu erzielen, unter anderem: nur Analysieren einer "interessanten" Teilmenge der Daten , in denen ein Muster gefunden …

94 hypothesis-testing statistical-significance p-value model-selection reproducible-research

13

Wie lassen sich Ausreißer in multivariaten Daten am besten identifizieren?

Angenommen, ich habe einen großen Satz multivariater Daten mit mindestens drei Variablen. Wie finde ich die Ausreißer? Paarweise Streudiagramme funktionieren nicht, da es möglich ist, dass ein Ausreißer in drei Dimensionen existiert, der in keinem der zweidimensionalen Teilräume ein Ausreißer ist. Ich denke nicht an ein Regressionsproblem, sondern an echte …

94 multivariate-analysis outliers

30

Welches Buch würden Sie nicht-statistischen Wissenschaftlern empfehlen?

Welches Buch würden Sie Wissenschaftlern empfehlen, die keine Statistiker sind? Klare Lieferung wird am meisten geschätzt. Sowie die Erklärung der geeigneten Techniken und Methoden für typische Aufgaben: Zeitreihenanalyse, Präsentation und Aggregation großer Datenmengen.

94 references

5

Umfassende Liste der Aktivierungsfunktionen in neuronalen Netzen mit Vor- und Nachteilen

Gibt es Referenzdokumente, die eine umfassende Liste der Aktivierungsfunktionen in neuronalen Netzen zusammen mit ihren Vor- und Nachteilen enthalten (und im Idealfall einige Hinweise auf Veröffentlichungen, bei denen sie erfolgreich waren oder nicht)?

94 neural-networks references

6

Tests zur Überprüfung grundlegender Daten

In meiner beruflichen Tätigkeit arbeite ich oft mit Datensätzen anderer Personen, Nicht-Experten bringen mir klinische Daten und ich helfe ihnen, diese zusammenzufassen und statistische Tests durchzuführen. Das Problem, das ich habe, ist, dass die Datensätze, die ich mitbringe, fast immer mit Tippfehlern, Inkonsistenzen und allen möglichen anderen Problemen durchsetzt sind. …

93 dataset outliers checking

3

Wie berechnen Sie die Genauigkeit und den Rückruf für die Klassifizierung mehrerer Klassen mithilfe der Verwirrungsmatrix?

Ich frage mich, wie man die Präzision berechnet und eine Verwirrungsmatrix für ein Klassifizierungsproblem mit mehreren Klassen verwendet. Insbesondere kann eine Beobachtung nur ihrer wahrscheinlichsten Klasse / Kennzeichnung zugeordnet werden. Ich würde gerne berechnen: Präzision = TP / (TP + FP) Rückruf = TP / (TP + FN) für jede …

92 machine-learning classification precision-recall multi-class

10

Warum muss eine Zeitreihe stationär sein?

Ich verstehe, dass eine stationäre Zeitreihe eine ist, deren Mittelwert und Varianz über die Zeit konstant ist. Kann jemand bitte erklären, warum wir sicherstellen müssen, dass unser Datensatz stationär ist, bevor wir verschiedene ARIMA- oder ARM-Modelle darauf ausführen können? Gilt dies auch für normale Regressionsmodelle, bei denen Autokorrelation und / …

92 regression time-series stationarity

12

Wer sind die Bayesianer?

Wenn man sich für Statistik interessiert, wird die Dichotomie "Frequentist" vs. "Bayesian" bald alltäglich (und wer hat Nate Silvers " Das Signal und das Rauschen " überhaupt nicht gelesen ?). In Vorträgen und Einführungskursen ist die Sichtweise überwiegend häufig ( MLE- , Werte), aber es bleibt in der Regel nur …

92 bayesian mathematical-statistics inference bayes frequentist

2

Was ist Kovarianz im Klartext?

Was ist Kovarianz im Klartext und wie hängt sie mit den Begriffen Abhängigkeit , Korrelation und Varianz-Kovarianz-Struktur in Bezug auf Wiederholungsentwürfe zusammen?

92 correlation repeated-measures terminology covariance independence

2

Was ist eine Einbettungsschicht in einem neuronalen Netzwerk?

In vielen neuronalen Netzwerkbibliotheken gibt es eingebettete Ebenen, wie in Keras oder Lasagne . Ich bin mir nicht sicher, ob ich seine Funktion verstehe, obwohl ich die Dokumentation gelesen habe. In der Keras-Dokumentation heißt es beispielsweise: Positive ganze Zahlen (Indizes) in Dichtevektoren fester Größe umwandeln, z. [[4], [20]] -> [[0,25, …

92 machine-learning neural-networks python word-embeddings