Ich möchte das Quantil einiger Daten schätzen. Die Daten sind so groß, dass sie nicht im Speicher gespeichert werden können. Und Daten sind nicht statisch, es kommen immer neue Daten. Kennt jemand einen Algorithmus zur Überwachung der Quantile der bisher beobachteten Daten mit sehr begrenztem Speicher und Rechenaufwand? Ich finde …
Jedes Lehrbuch, das ich bisher gesehen habe, beschreibt ML-Algorithmen und wie man sie implementiert. Gibt es auch ein Lehrbuch, das Theoreme und Beweise für das Verhalten dieser Algorithmen erstellt? zB, dass unter den Bedingungen Gradientenabstieg immer zu A , B , C führt ?x,y,zx,y,zx,y,zA,B,CA,B,CA,B,C
In dieser Frage geht es um eine effiziente Methode zur Berechnung von Hauptkomponenten. Viele Texte zur linearen PCA befürworten die Verwendung der Singulärwertzerlegung der fallweisen Daten . Das heißt, wenn wir Daten und wollen die Variablen (seine ersetzen Spalten ) von Hauptkomponenten, wir tun SVD: X = U S V …
Ich muss sofort klarstellen, dass ich ein praktizierender Softwareentwickler bin, kein Statistiker, und dass meine College-Statistik-Klasse schon sehr lange her ist… Allerdings würde ich gerne wissen, ob es eine Methode zum Sammeln einer Reihe von beschreibenden Statistiken gibt, mit der dann ein Boxplot erstellt werden kann, bei dem keine einzelnen …
Ich habe eine Menge versteckter Markov-Modelle gelesen und konnte selbst eine ziemlich einfache Version davon programmieren. Aber es gibt zwei Möglichkeiten, die ich zu lernen scheine. Zum einen muss es gelesen und in Code implementiert werden (was getan wird), und zum anderen muss verstanden werden, wie es in verschiedenen Situationen …
Nach der Durchführung der Hauptkomponentenanalyse (PCA) möchte ich einen neuen Vektor auf den PCA-Raum projizieren (dh seine Koordinaten im PCA-Koordinatensystem finden). Ich habe PCA in R-Sprache mit berechnet prcomp. Jetzt sollte ich meinen Vektor mit der PCA-Rotationsmatrix multiplizieren können. Sollen die Hauptkomponenten in dieser Matrix in Zeilen oder Spalten angeordnet …
Aufgrund ihrer Kovarianzmatrix (ihre Leistungsspektraldichten (PSDs) und Kreuzleistungsspektraldichten (CSDs)) habe ich Probleme, eine Reihe stationärer farbiger Zeitreihen zu erstellen. Ich weiß, dass ich mit zwei Zeitreihen und ihre Leistungsspektraldichten (PSDs) und Kreuzspektraldichten (CSDs) unter Verwendung vieler allgemein verfügbarer Routinen abschätzen kann, wie z und Funktionen in Matlab usw. Die PSDs …
aus math.stackexchange migriert . Ich verarbeite einen langen Strom von ganzen Zahlen und überlege, einige Momente nachzuverfolgen, um ungefähr verschiedene Perzentile für den Strom berechnen zu können, ohne viele Daten zu speichern. Was ist der einfachste Weg, um Perzentile von wenigen Augenblicken an zu berechnen? Gibt es einen besseren Ansatz, …
Ich bin kein Experte für zufällige Gesamtstrukturen, aber ich verstehe klar, dass das Hauptproblem bei zufälligen Gesamtstrukturen die (zufällige) Baumgenerierung ist. Können Sie mir erklären, wie die Bäume entstehen? (dh was ist die verwendete Verteilung für die Baumerzeugung?) Danke im Voraus !
Ich versuche, die rechnerische Komplexität / Schätzgeschwindigkeit von drei Gruppen von Methoden für die lineare Regression zu vergleichen, wie sie in Hastie et al. "Elemente des statistischen Lernens" (2. Aufl.), Kapitel 3: Auswahl der Teilmenge Schrumpfmethoden Methoden mit abgeleiteten Eingaberichtungen (PCR, PLS) Der Vergleich kann sehr grob sein, nur um …
Ist die Umsetzung von ER effizienter (ähnlich Extreme Gradient Boostingwie die Steigerung des Gradienten) - ist der Unterschied aus praktischer Sicht wichtig? Es gibt ein R-Paket, das sie implementiert. Ist es ein neuer Algorithmus, der die "generische" Implementierung (RandomForest-Paket von R) nicht nur hinsichtlich der Effizienz oder auch in einigen …
Ich muss den Mahalanobis-Abstand in R zwischen jedem Beobachtungspaar in einer n×pn×pn \times p Matrix von Kovariaten berechnen. Ich benötige eine effiziente Lösung, dh es werden nur Abstände berechnet und vorzugsweise in C / RCpp / Fortran usw. implementiert. Ich gehe davon aus, dass , die Populationskovarianzmatrix, unbekannt ist, und …
Angenommen, ich habe eine dichte Matrix der Größe und der SVD-ZerlegungIn ich die SVD berechnen sich wie folgt: .EINEIN \textbf{A}m × nm×nm \times nA = U S V⊤.EIN=USV⊤.\mathbf{A}=\mathbf{USV}^\top.Rsvd(A) Wenn eine neue -te Zeile zu hinzugefügt wird , kann man die neue SVD-Zerlegung basierend auf der alten (dh unter Verwendung von …
Mit folgendem Code kann eine logit-Regression in R durchgeführt werden: > library(MASS) > data(menarche) > glm.out = glm(cbind(Menarche, Total-Menarche) ~ Age, + family=binomial(logit), data=menarche) > coefficients(glm.out) (Intercept) Age -21.226395 1.631968 Es sieht so aus, als ob der Optimierungsalgorithmus konvergiert hat - es gibt Informationen über die Schrittanzahl des Fisher-Scoring-Algorithmus: Call: …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.