Statistiken und Big Data

Fragen und Antworten für Personen, die sich für Statistik, maschinelles Lernen, Datenanalyse, Data Mining und Datenvisualisierung interessieren

6
Rückausbreitung mit Softmax / Cross Entropy
Ich versuche zu verstehen, wie Backpropagation für eine Softmax / Cross-Entropy-Ausgabeebene funktioniert. Die Kreuzentropiefehlerfunktion ist E(t,o)=−∑jtjlogojE(t,o)=−∑jtjlog⁡ojE(t,o)=-\sum_j t_j \log o_j mit und als Ziel bzw. Ausgabe bei Neuron . Die Summe befindet sich über jedem Neuron in der Ausgabeschicht. selbst ist das Ergebnis der Softmax-Funktion:tttooojjjojojo_j oj=softmax(zj)=ezj∑jezjoj=softmax(zj)=ezj∑jezjo_j=softmax(z_j)=\frac{e^{z_j}}{\sum_j e^{z_j}} Wieder ist die Summe …





2
Messungen von unterschiedlicher Bedeutung in zufälligen Wäldern
Ich habe mit zufälligen Wäldern für die Regression herumgespielt und habe Schwierigkeiten, genau herauszufinden, was die beiden wichtigen Maße bedeuten und wie sie interpretiert werden sollten. Die importance()Funktion gibt für jede Variable zwei Werte an: %IncMSEund IncNodePurity. Gibt es einfache Interpretationen für diese 2 Werte? Ist dies IncNodePurityinsbesondere einfach der …

3
Wie werden F- und p-Werte in ANOVA interpretiert?
Ich bin neu in der Statistik und beschäftige mich derzeit mit ANOVA. Ich führe einen ANOVA-Test in R mit aov(dependendVar ~ IndependendVar) Ich bekomme unter anderem einen F-Wert und einen p-Wert. Meine Nullhypothese ( ) lautet, dass alle Gruppenmittelwerte gleich sind.H0H0H_0 Es gibt viele Informationen darüber, wie F berechnet wird …

4
Logistische Regression in R (Odds Ratio)
Ich versuche eine logistische Regressionsanalyse durchzuführen R. Ich habe Kurse besucht, die dieses Material mit STATA behandeln. Ich finde es sehr schwierig, die Funktionalität in zu replizieren R. Ist es in diesem Bereich ausgereift? Es scheint wenig Dokumentation oder Anleitung zu geben. Die Erstellung der Odds Ratio-Ausgabe erfordert anscheinend die …
40 r  logistic  odds-ratio 

3
Empirische Beziehung zwischen Mittelwert, Median und Modus
Für eine unimodale Verteilung, die mäßig verzerrt ist, haben wir die folgende empirische Beziehung zwischen Mittelwert, Median und Modus: Wie war diese Beziehung? abgeleitet?(Mean - Mode)∼3(Mean - Median)(Mean - Mode)∼3(Mean - Median) \text{(Mean - Mode)}\sim 3\,\text{(Mean - Median)} Hat Karl Pearson Tausende dieser Beziehungen geplant, bevor er diese Schlussfolgerung gezogen …

7
Datennormalisierung und -standardisierung in neuronalen Netzen
Ich versuche, das Ergebnis eines komplexen Systems mithilfe neuronaler Netze (ANNs) vorherzusagen. Die (abhängigen) Ergebniswerte liegen zwischen 0 und 10.000. Die verschiedenen Eingangsvariablen haben unterschiedliche Bereiche. Alle Variablen haben ungefähr normale Verteilungen. Ich betrachte verschiedene Möglichkeiten, um die Daten vor dem Training zu skalieren. Eine Möglichkeit besteht darin, die Eingangsvariablen …

3
Gibt es Fälle, in denen PCA geeigneter ist als t-SNE?
Ich möchte sehen, wie sich 7 Messgrößen des Textkorrekturverhaltens (Zeitaufwand für die Korrektur des Texts, Anzahl der Tastenanschläge usw.) aufeinander beziehen. Die Maßnahmen sind korreliert. Ich führte eine PCA durch, um zu sehen, wie die Kennzahlen auf PC1 und PC2 projiziert wurden, wodurch vermieden wurde, dass separate Zwei-Wege-Korrelationstests zwischen den …
39 pca  tsne 




7
Würde ein Bayesianer zugeben, dass es einen festen Parameterwert gibt?
In der Bayes'schen Datenanalyse werden Parameter als Zufallsvariablen behandelt. Dies ergibt sich aus der Bayes'schen subjektiven Konzeptualisierung der Wahrscheinlichkeit. Aber erkennen Bayesianer theoretisch an, dass es in der "realen Welt" einen echten festen Parameterwert gibt? Die offensichtliche Antwort scheint "Ja" zu sein, denn dann wäre es fast unsinnig, den Parameter …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.