Online-Algorithmen beziehen sich auf Berechnungen, die iterativ durchgeführt werden, wobei Daten während der Berechnung eintreffen. Bei Fragen zum Internet verwenden Sie bitte das Tag "Internet".
Was ist der Unterschied zwischen Offline- und Online-Lernen ? Geht es nur darum, über den gesamten Datensatz (offline) zu lernen oder inkrementell (jeweils eine Instanz) zu lernen? Was sind Beispiele für Algorithmen, die in beiden verwendet werden?
In einem Artikel "Genaue Berechnung der Laufabweichung" unter http://www.johndcook.com/standard_deviation.html wird gezeigt, wie der Laufmittelwert, die Laufabweichung und die Standardabweichungen berechnet werden. Gibt es Algorithmen, bei denen die Parameter eines linearen oder logistischen Regressionsmodells ähnlich "dynamisch" aktualisiert werden können, wenn neue Trainingsaufzeichnungen bereitgestellt werden?
Ich habe in letzter Zeit mit großen Datenmengen gearbeitet und viele Artikel über Streaming-Methoden gefunden. Um ein paar zu nennen: Follow-the-Regularized-Leader und Mirror-Descent: Äquivalenzsätze und L1-Regularisierung ( http://jmlr.org/proceedings/papers/v15/mcmahan11b/mcmahan11b.pdf ) Gestreamtes Lernen: SVMs mit einem Durchgang ( http://www.umiacs.umd.edu/~hal/docs/daume09onepass.pdf ) Pegasos: Primal Estimated sub-GrAdient SOlver für SVM http://ttic.uchicago.edu/~nati/Publications/PegasosMPB.pdf oder hier: Kann SVM …
Ich habe ein Array von reellen Werten, die den Mittelwert von μ o l d und die Standardabweichung von σ o l d haben . Wenn ein Element des Arrays x i durch ein anderes Element x j ersetzt wird , lautet der neue Mittelwertnnnμo l dμÖld\mu_{old}σo l dσÖld\sigma_{old}xichxichx_ixjxjx_j μn …
Ich habe ein kleines Problem, das mich ausflippen lässt. Ich muss eine Prozedur für einen Online-Erfassungsprozess einer multivariaten Zeitreihe schreiben. In jedem Zeitintervall (zum Beispiel 1 Sekunde) erhalte ich eine neue Stichprobe, die im Grunde genommen ein Gleitkomma-Vektor der Größe N ist. Die Operation, die ich ausführen muss, ist etwas …
Derzeit lese ich die Arbeit Efficient Online and Batch Learning mit Forward-Backward Splitting von John Duchi und Yoram Singer. Ich bin sehr verwirrt über die Verwendung der Begriffe "Online" und "Batch". Ich dachte, "Online" bedeutet, dass wir die Gewichtsparameter nach der Verarbeitung einer Einheit der Trainingsdaten aktualisieren. Dann verwenden wir …
Allgemeine Frage Nehmen wir an, wir haben iid-Daten x1x1x_1 , x2x2x_2 , ... einströmen. Wir möchten die maximale Wahrscheinlichkeitsschätzung von \ boldsymbol {\ theta} rekursiv berechnen. . Das heißt, nachdem \ hat {\ boldsymbol {\ theta}} _ {n-1} = \ underset {\ boldsymbol {\ theta} \ in \ mathbb {R} …
Es gibt bekannte Online-Formeln zur Berechnung von exponentiell gewichteten gleitenden Durchschnitten und Standardabweichungen eines Prozesses . Für den Mittelwert,(xn)n=0,1,2,…(xn)n=0,1,2,…(x_n)_{n=0,1,2,\dots} μn=(1−α)μn−1+αxnμn=(1−α)μn−1+αxn\mu_n = (1-\alpha) \mu_{n-1} + \alpha x_n und für die Varianz σ2n=(1−α)σ2n−1+α(xn−μn−1)(xn−μn)σn2=(1−α)σn−12+α(xn−μn−1)(xn−μn)\sigma_n^2 = (1-\alpha) \sigma_{n-1}^2 + \alpha(x_n - \mu_{n-1})(x_n - \mu_n) woraus Sie die Standardabweichung berechnen können. Gibt es ähnliche Formeln …
Nehmen wir an, ich habe einen logistischen Regressionsklassifikator. Beim normalen Batch-Lernen hätte ich einen Regularizer-Term, um eine Überanpassung zu verhindern und meine Gewichte klein zu halten. Ich würde auch meine Funktionen normalisieren und skalieren. In einer Online-Lernumgebung erhalte ich einen kontinuierlichen Datenstrom. Ich führe mit jedem Beispiel ein Gefälle-Update durch …
Ich habe den Begriff "Heywood-Fall" informell verwendet, um Situationen zu bezeichnen, in denen eine online durchgeführte, "endliche Antwort" iterativ aktualisierte Schätzung der Varianz aufgrund von numerischen Genauigkeitsproblemen negativ wurde. (Ich verwende eine Variante der Welford-Methode, um Daten hinzuzufügen und ältere Daten zu entfernen.) Ich hatte den Eindruck, dass sie auf …
Ich muss Quartile (Q1, Median und Q3) in Echtzeit mit einer großen Datenmenge berechnen, ohne die Beobachtungen zu speichern. Ich habe zuerst den P-Quadrat-Algorithmus (Jain / Chlamtac) ausprobiert, war aber nicht zufrieden damit (etwas zu viel CPU-Auslastung und nicht überzeugt von der Genauigkeit zumindest meines Datensatzes). Ich verwende jetzt den …
Kann mich jemand auf einen (rekursiven) Online-Algorithmus für die Tikhonov-Regularisierung (regularisierte kleinste Quadrate) hinweisen? In einer Offline-Einstellung würde ich Verwendung meines ursprünglichen Datensatzes berechnen, wobei unter Verwendung der n-fachen Kreuzvalidierung gefunden wird. Ein neuer Wert kann für ein gegebenes x mit y = x ^ T \ hat \ beta …
Dies wurde durch eine effiziente lineare Online-Regression inspiriert , die ich sehr interessant fand. Gibt es Texte oder Ressourcen, die für statistische Berechnungen in großem Maßstab vorgesehen sind, bei denen die Datenmengen zu groß sind, um in den Hauptspeicher zu passen, und die möglicherweise zu unterschiedlich sind, um eine effektive …
Ich habe in letzter Zeit versucht, mehr über Online-Lernen zu lernen (es ist absolut faszinierend!), Und ein Thema, das ich nicht richtig verstehen konnte, ist, wie man über Modellauswahl in Offline- oder Online-Kontexten nachdenkt. Insbesondere nehmen wir trainieren ein Klassifikator offline, basierend auf einer festen Datensatz D . Wir schätzen …
Ich möchte eine inkrementelle Gaußsche Prozessregression mithilfe eines Schiebefensters über den Datenpunkten implementieren, das nacheinander über einen Stream ankommt. Lassen die Dimensionalität des Eingangsraums bezeichnen. Jeder Datenpunkt hat also Anzahl von Elementen.dddxixix_iddd Sei die Größe des Schiebefensters.nnn Um Vorhersagen zu treffen, muss ich die Inverse der Grammmatrix berechnen , wobei …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.