Warum runif()generieren Zufallszahlengeneratoren wie in R nicht jedes Mal das gleiche Ergebnis? Beispielsweise: X <- runif(100) X generiert jedes Mal unterschiedliche Ausgänge. Was ist der Grund dafür, jedes Mal unterschiedliche Ausgaben zu generieren? Welche Funktionen hat es im Hintergrund, um dies zu tun?
Ich bin ein Neuling im Bereich maschinelles Lernen (auch einige Statistiken), habe eine Weile Wissen gelernt (überwachte / unbeaufsichtigte Lernalgorithmen, relevante Optimierungsmethoden, Regularisierungen, einige Philosophien (wie Bias-Varianz-Kompromiss?)). Ich weiß, dass ich ohne echte Übung kein tiefes Verständnis für diese maschinellen Lerninhalte gewinnen würde. Ich beginne also mit einem Klassifizierungsproblem mit …
Ich fand ein sehr hilfreiches Tutorial zum EM-Algorithmus . Das Beispiel und das Bild aus dem Tutorial sind einfach genial. Verwandte Frage zur Berechnung von Wahrscheinlichkeiten Wie funktioniert die Erwartungsmaximierung? Ich habe noch eine Frage, wie man die im Tutorial beschriebene Theorie mit dem Beispiel verbindet. gtgtg_tlogP(x;Θ)logP(x;Θ)\log P(x;\Theta)gt(Θ^(t))=logP(x;Θ^(t))gt(Θ^(t))=logP(x;Θ^(t))g_t( \hat{\Theta}^{(t)}) = …
Gibt es eine numerisch stabile Methode zur Berechnung der Werte einer Beta-Verteilung für Alpha, Beta (z. B. Alpha, Beta> 1000000)? Eigentlich brauche ich nur ein 99% -Konfidenzintervall um den Modus, wenn das das Problem irgendwie einfacher macht. Hinzufügen : Es tut mir leid, meine Frage war nicht so klar gestellt, …
Ich versuche, den Nelder-Mead-Algorithmus zur Optimierung einer Funktion zu implementieren. Die Wikipedia-Seite über Nelder-Mead ist überraschend klar über den gesamten Algorithmus, mit Ausnahme seines Stoppkriteriums. Dort heißt es leider: Auf Konvergenz prüfen [Klarstellung erforderlich] . Ich habe selbst einige Kriterien ausprobiert und getestet: Stoppen Sie, wenn wobei ϵ klein ist …
Wenn ich eine feste nicht wiederkehrende (DAG) Topologie (fester Satz von Knoten und Kanten, aber der Lernalgorithmus kann das Gewicht an den Kanten variieren) von Sigmoidneuronen mit Eingangsneuronen habe, die nur Zeichenfolgen in als Eingabe und führt zu einer Ausgabe (die einen realen Wert ausgibt, den wir auf 1 oder …
Haftungsausschluss: Ich habe diese Frage auf Stackoverflow gepostet, dachte aber, dass dies möglicherweise besser für diese Plattform geeignet ist. Wie testen Sie Ihre eigene k-means-Implementierung für mehrdimensionale Datensätze? Ich dachte daran, eine bereits vorhandene Implementierung (dh Matlab) für die Daten auszuführen und die Ergebnisse mit meinem Algorithmus zu vergleichen. Dies …
Die klassische Methode der Hauptkomponentenanalyse (PCA) besteht darin, sie auf einer Eingabedatenmatrix durchzuführen, deren Spalten den Mittelwert Null haben (dann kann PCA die Varianz "maximieren"). Dies kann leicht durch Zentrieren der Säulen erreicht werden. Wenn jedoch die Eingabematrix dünn ist, ist die zentrierte Matrix jetzt länger dünn und passt - …
Ich habe ein wenig über das Verbessern von Algorithmen für Klassifizierungsaufgaben und insbesondere von Adaboost gelesen. Ich verstehe, dass der Zweck von Adaboost darin besteht, mehrere "schwache Lernende" aufzunehmen und durch eine Reihe von Iterationen von Trainingsdaten die Klassifizierer dazu zu bringen, Klassen vorherzusagen, bei denen die Modelle wiederholt Fehler …
Kontext: Ich entwickle ein System, das klinische Daten analysiert, um unplausible Daten herauszufiltern, bei denen es sich möglicherweise um Tippfehler handelt. Was ich bisher gemacht habe: Um die Plausibilität zu quantifizieren, habe ich bisher versucht, die Daten zu normalisieren und dann einen Plausibilitätswert für Punkt p basierend auf seiner Entfernung …
Dies sind meine Trainingsdaten: 200.000 Beispiele x 10.000 Funktionen. Meine Trainingsdatenmatrix ist also - 200.000 x 10.000. Ich habe es geschafft, dies in einer flachen Datei ohne Speicherprobleme zu speichern, indem ich jeden Datensatz einzeln (ein Beispiel nach dem anderen) gespeichert habe, während ich die Funktionen für jedes Beispiel generierte. …
Geschlossen. Diese Frage ist nicht zum Thema . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so dass es beim Thema für Kreuz Validated. Geschlossen vor 2 Jahren . Mein Ziel: Ich hätte gerne eine Funktion, die eine E-Mail-Adresse verwendet und eine quasi zufällige …
Ich habe eine Reihe von Elementen die ich anhand von Merkmalen beschreiben kann . Somit:X.XXnnn xich: { ci 1, ci 2, … , C.i n} ∣ xich∈ X.xi:{ci1,ci2,…,cin}∣xi∈Xx_i: \{c_{i1}, c_{i2}, \ldots, c_{in}\} \mid x_i \in X wobei die (numerische) Bewertung für das Element gemäß den Merkmalen . So können meine …
Ich bin auf das folgende Simulationsproblem : Bei einer Menge bekannter reeller Zahlen wird eine Verteilung auf durch wobei den positiven Teil von . Ich kann mir zwar einen Metropolis-Hastings-Sampler vorstellen, der auf diese Verteilung abzielt, aber ich frage mich, ob es einen effizienten direkten Sampler gibt, der die große …
Ich benötige einen Algorithmus, um eine abgeschnittene Multinomialverteilung abzutasten. Das ist, x⃗ ∼ 1Z.px11… P.xkkx1! … X.k!x→∼1Zp1x1…pkxkx1!…xk!\vec x \sim \frac{1}{Z} \frac{p_1^{x_1} \dots p_k^{x_k}}{x_1!\dots x_k!} wobei eine Normierungskonstante ist, hat positive Komponenten und . Ich betrachte nur Werte von im Bereich .→ x k ∑ x i = n → x …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.