Warum werden in neuronalen Netzen Bias-Knoten verwendet? Wie viele solltest du verwenden? In welchen Ebenen sollten Sie sie verwenden: Alle ausgeblendeten Ebenen und die Ausgabeebene?
Nachdem ich kürzlich Bootstrap studiert hatte, stellte ich mir eine konzeptionelle Frage, die mich immer noch verwirrt: Sie haben eine Population und möchten ein Populationsattribut kennen, dh , wobei ich P verwende, um die Population darzustellen. Dies θ könnte beispielsweise ein Populationsmittelwert sein. Normalerweise können Sie nicht alle Daten aus …
Eine Metaanalyse umfasst eine Reihe von Studien, von denen alle einen P-Wert von mehr als 0,05 berichteten. Kann die gesamte Metaanalyse einen P-Wert von weniger als 0,05 ausweisen? Unter welchen Umständen? (Ich bin mir ziemlich sicher, dass die Antwort ja lautet, aber ich hätte gerne eine Referenz oder Erklärung.)
Angenommen, wir haben eine Zufallsvariable . Wenn der wahre Parameter wäre, sollte die Wahrscheinlichkeitsfunktion maximiert und die Ableitung gleich Null sein. Dies ist das Grundprinzip des Maximum-Likelihood-Schätzers.X∼f(x|θ)X∼f(x|θ)X \sim f(x|\theta)θ0θ0\theta_0 Wie ich es verstehe, ist Fisher Information definiert als I(θ)=E[(∂∂θf(X|θ))2]I(θ)=E[(∂∂θf(X|θ))2]I(\theta) = \Bbb E \Bigg[\left(\frac{\partial}{\partial \theta}f(X|\theta)\right)^2\Bigg ] Wenn also der wahre Parameter …
Ich habe eine experimentell beobachtete Verteilung, die einer Gamma- oder Lognormalverteilung sehr ähnlich sieht. Ich habe gelesen, dass die Lognormalverteilung die maximale Entropiewahrscheinlichkeitsverteilung für eine Zufallsvariable für die der Mittelwert und die Varianz von ln ( X ) festgelegt sind. Hat die Gamma-Verteilung ähnliche Eigenschaften?XXXln(X)ln(X)\ln(X)
Einerseits habe ich die Regression zum Mittelwert und andererseits habe ich den Trugschluss des Spielers . Der Irrtum von Gambler wird von Miller und Sanjurjo (2019) definiert als "die irrtümliche Annahme, dass zufällige Sequenzen eine systematische Tendenz zur Umkehrung aufweisen, dh dass Streifen mit ähnlichen Ergebnissen eher enden als andauern". …
Wenn ein Parameter gebootet wird, um den Standardfehler zu erhalten, erhalten wir eine Verteilung des Parameters. Warum verwenden wir nicht den Mittelwert dieser Verteilung als Ergebnis oder Schätzung für den Parameter, den wir erhalten möchten? Sollte sich die Verteilung nicht der tatsächlichen annähern? Daher würden wir eine gute Schätzung des …
Hintergrund Angenommen, wir haben ein gewöhnliches Modell der kleinsten Quadrate, in dem wir kkk Koeffizienten in unserem Regressionsmodell haben, y=Xβ+ϵy=Xβ+ϵ\mathbf{y}=\mathbf{X}\mathbf{\beta} + \mathbf{\epsilon} wobei ββ\mathbf{\beta} ein (k×1)(k×1)(k\times1) Koeffizientenvektor ist, ist XX\mathbf{X} die Entwurfsmatrix durch definierte X=⎛⎝⎜⎜⎜⎜⎜⎜11⋮1x11x21xn1x12…⋱………x1(k−1)⋮⋮xn(k−1)⎞⎠⎟⎟⎟⎟⎟⎟X=(1x11x12…x1(k−1)1x21…⋮⋮⋱⋮1xn1……xn(k−1))\mathbf{X} = \begin{pmatrix} 1 & x_{11} & x_{12} & \dots & x_{1\;(k-1)} \\ 1 & x_{21} …
Wie werden Standardfehler berechnet, wenn Sie einen angepassten Wert aus einem logistischen Regressionsmodell vorhersagen? Ich meine für die angepassten Werte , nicht für die Koeffizienten (die Fishers Informationsmatrix beinhaltet). Ich habe nur herausgefunden, wie ich die Zahlen erhalten kann R(z. B. hier in r-help oder hier in Stack Overflow), aber …
Ich möchte GLM und Elastic Net verwenden, um die relevanten Features auszuwählen und ein lineares Regressionsmodell zu erstellen (dh sowohl Vorhersage als auch Verständnis, daher ist es besser, relativ wenige Parameter zu haben). Die Ausgabe erfolgt kontinuierlich. Es sind Gene pro Fälle. Ich habe über das Paket gelesen , bin …
Ich wollte eine Klassendemonstration durchführen, bei der ich ein t-Intervall mit einem Bootstrap-Intervall vergleiche und die Überdeckungswahrscheinlichkeit für beide berechne. Ich wollte, dass die Daten aus einer verzerrten Verteilung stammen, also habe ich mich dafür entschieden, die Daten als exp(rnorm(10, 0, 2)) + 1eine Stichprobe der Größe 10 aus einem …
Kann eine Einweg- ANOVA (mit Gruppen oder "Niveaus") einen signifikanten Unterschied melden, wenn keiner der paarweisen N ( N - 1 ) / 2 t-Tests dies tut?N>2N>2N>2N(N−1)/2N(N−1)/2N(N-1)/2 In dieser Antwort schrieb @whuber: Es ist allgemein bekannt, dass ein globaler ANOVA-F-Test eine Mittelwertdifferenz erkennen kann, selbst wenn kein individueller [unangepasster paarweiser] …
Ich bin etwas verwirrt über die Area Under Curve (AUC) von ROC und die allgemeine Genauigkeit. Wird die AUC proportional zur Gesamtgenauigkeit sein? Mit anderen Worten, wenn wir eine größere Gesamtgenauigkeit haben, werden wir definitiv eine größere AUC bekommen? Oder sind sie per definitionem positiv korreliert? Wenn sie positiv korreliert …
Ich bin ein bisschen verwirrt mit dem Unterschied zwischen einem SVM und einem Perzeptron. Lassen Sie mich hier versuchen, mein Verständnis zusammenzufassen, und bitte korrigieren Sie, wo ich falsch liege, und füllen Sie das aus, was ich verpasst habe. Das Perceptron versucht nicht, den Abstand zu optimieren. Solange eine Hyperebene …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.