Ich versuche zu verstehen, wie Backpropagation für eine Softmax / Cross-Entropy-Ausgabeebene funktioniert. Die Kreuzentropiefehlerfunktion ist E(t,o)=−∑jtjlogojE(t,o)=−∑jtjlogojE(t,o)=-\sum_j t_j \log o_j mit und als Ziel bzw. Ausgabe bei Neuron . Die Summe befindet sich über jedem Neuron in der Ausgabeschicht. selbst ist das Ergebnis der Softmax-Funktion:tttooojjjojojo_j oj=softmax(zj)=ezj∑jezjoj=softmax(zj)=ezj∑jezjo_j=softmax(z_j)=\frac{e^{z_j}}{\sum_j e^{z_j}} Wieder ist die Summe …
Ich frage mich, ob jemand allgemeine Faustregeln in Bezug auf die Anzahl der zu verwendenden Bootstrap-Beispiele kennt, basierend auf den Merkmalen der Daten (Anzahl der Beobachtungen usw.) und / oder den enthaltenen Variablen.
Was ist eine Suppressorvariable bei multipler Regression und wie kann der Suppressionseffekt visuell dargestellt werden (seine Mechanik oder sein Beweis in den Ergebnissen)? Ich möchte alle einladen, die einen Gedanken haben, zu teilen.
"Big Data" ist in den Medien allgegenwärtig. Alle sagen, dass "Big Data" die große Sache für 2012 ist, z. B. die KDNuggets-Umfrage zu aktuellen Themen für 2012 . Ich habe hier jedoch tiefe Bedenken. Mit Big Data scheint jeder glücklich zu sein, nur etwas herauszubekommen. Aber verstoßen wir nicht gegen …
Ich muss einen 95% -KI auf dem Median und anderen Perzentilen finden. Ich weiß nicht, wie ich das angehen soll. Ich benutze hauptsächlich R als Programmierwerkzeug.
Ich habe mit zufälligen Wäldern für die Regression herumgespielt und habe Schwierigkeiten, genau herauszufinden, was die beiden wichtigen Maße bedeuten und wie sie interpretiert werden sollten. Die importance()Funktion gibt für jede Variable zwei Werte an: %IncMSEund IncNodePurity. Gibt es einfache Interpretationen für diese 2 Werte? Ist dies IncNodePurityinsbesondere einfach der …
Ich bin neu in der Statistik und beschäftige mich derzeit mit ANOVA. Ich führe einen ANOVA-Test in R mit aov(dependendVar ~ IndependendVar) Ich bekomme unter anderem einen F-Wert und einen p-Wert. Meine Nullhypothese ( ) lautet, dass alle Gruppenmittelwerte gleich sind.H0H0H_0 Es gibt viele Informationen darüber, wie F berechnet wird …
Ich versuche eine logistische Regressionsanalyse durchzuführen R. Ich habe Kurse besucht, die dieses Material mit STATA behandeln. Ich finde es sehr schwierig, die Funktionalität in zu replizieren R. Ist es in diesem Bereich ausgereift? Es scheint wenig Dokumentation oder Anleitung zu geben. Die Erstellung der Odds Ratio-Ausgabe erfordert anscheinend die …
Für eine unimodale Verteilung, die mäßig verzerrt ist, haben wir die folgende empirische Beziehung zwischen Mittelwert, Median und Modus: Wie war diese Beziehung? abgeleitet?(Mean - Mode)∼3(Mean - Median)(Mean - Mode)∼3(Mean - Median) \text{(Mean - Mode)}\sim 3\,\text{(Mean - Median)} Hat Karl Pearson Tausende dieser Beziehungen geplant, bevor er diese Schlussfolgerung gezogen …
Ich versuche, das Ergebnis eines komplexen Systems mithilfe neuronaler Netze (ANNs) vorherzusagen. Die (abhängigen) Ergebniswerte liegen zwischen 0 und 10.000. Die verschiedenen Eingangsvariablen haben unterschiedliche Bereiche. Alle Variablen haben ungefähr normale Verteilungen. Ich betrachte verschiedene Möglichkeiten, um die Daten vor dem Training zu skalieren. Eine Möglichkeit besteht darin, die Eingangsvariablen …
Ich möchte sehen, wie sich 7 Messgrößen des Textkorrekturverhaltens (Zeitaufwand für die Korrektur des Texts, Anzahl der Tastenanschläge usw.) aufeinander beziehen. Die Maßnahmen sind korreliert. Ich führte eine PCA durch, um zu sehen, wie die Kennzahlen auf PC1 und PC2 projiziert wurden, wodurch vermieden wurde, dass separate Zwei-Wege-Korrelationstests zwischen den …
Ich bin ein Wirtschafts- / Statistikmajor. Mir ist bewusst, dass Ökonomen versucht haben, ihre Annahmen über menschliches Verhalten und Rationalität zu ändern, indem sie Situationen identifiziert haben, in denen sich Menschen nicht rational verhalten. Angenommen, ich biete Ihnen eine 100% ige Chance auf einen Verlust von 1000 USD oder eine …
Ich bin nicht auf der Suche nach einer Plug-and-Play-Methode wie BEST in R, sondern nach einer mathematischen Erklärung einiger Bayes'scher Methoden, mit denen ich die Differenz zwischen dem Mittelwert zweier Stichproben testen kann.
Was ist der Unterschied zwischen Wahrscheinlichkeitsdiagrammen, PP-Diagrammen und QQ-Diagrammen, wenn versucht wird, eine angepasste Verteilung auf Daten zu analysieren?
In der Bayes'schen Datenanalyse werden Parameter als Zufallsvariablen behandelt. Dies ergibt sich aus der Bayes'schen subjektiven Konzeptualisierung der Wahrscheinlichkeit. Aber erkennen Bayesianer theoretisch an, dass es in der "realen Welt" einen echten festen Parameterwert gibt? Die offensichtliche Antwort scheint "Ja" zu sein, denn dann wäre es fast unsinnig, den Parameter …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.