Als «online» getaggte Fragen

Online-Algorithmen beziehen sich auf Berechnungen, die iterativ durchgeführt werden, wobei Daten während der Berechnung eintreffen. Bei Fragen zum Internet verwenden Sie bitte das Tag "Internet".

3
Online oder Offline lernen?
Was ist der Unterschied zwischen Offline- und Online-Lernen ? Geht es nur darum, über den gesamten Datensatz (offline) zu lernen oder inkrementell (jeweils eine Instanz) zu lernen? Was sind Beispiele für Algorithmen, die in beiden verwendet werden?

7
Gibt es Algorithmen zur Berechnung laufender linearer oder logistischer Regressionsparameter?
In einem Artikel "Genaue Berechnung der Laufabweichung" unter http://www.johndcook.com/standard_deviation.html wird gezeigt, wie der Laufmittelwert, die Laufabweichung und die Standardabweichungen berechnet werden. Gibt es Algorithmen, bei denen die Parameter eines linearen oder logistischen Regressionsmodells ähnlich "dynamisch" aktualisiert werden können, wenn neue Trainingsaufzeichnungen bereitgestellt werden?

1
Hochmodernes Streaming-Lernen
Ich habe in letzter Zeit mit großen Datenmengen gearbeitet und viele Artikel über Streaming-Methoden gefunden. Um ein paar zu nennen: Follow-the-Regularized-Leader und Mirror-Descent: Äquivalenzsätze und L1-Regularisierung ( http://jmlr.org/proceedings/papers/v15/mcmahan11b/mcmahan11b.pdf ) Gestreamtes Lernen: SVMs mit einem Durchgang ( http://www.umiacs.umd.edu/~hal/docs/daume09onepass.pdf ) Pegasos: Primal Estimated sub-GrAdient SOlver für SVM http://ttic.uchicago.edu/~nati/Publications/PegasosMPB.pdf oder hier: Kann SVM …





2
Exponentiell gewichtete Bewegungsschiefe / Kurtosis
Es gibt bekannte Online-Formeln zur Berechnung von exponentiell gewichteten gleitenden Durchschnitten und Standardabweichungen eines Prozesses . Für den Mittelwert,(xn)n=0,1,2,…(xn)n=0,1,2,…(x_n)_{n=0,1,2,\dots} μn=(1−α)μn−1+αxnμn=(1−α)μn−1+αxn\mu_n = (1-\alpha) \mu_{n-1} + \alpha x_n und für die Varianz σ2n=(1−α)σ2n−1+α(xn−μn−1)(xn−μn)σn2=(1−α)σn−12+α(xn−μn−1)(xn−μn)\sigma_n^2 = (1-\alpha) \sigma_{n-1}^2 + \alpha(x_n - \mu_{n-1})(x_n - \mu_n) woraus Sie die Standardabweichung berechnen können. Gibt es ähnliche Formeln …

3
Regularisierung und Feature-Skalierung beim Online-Lernen?
Nehmen wir an, ich habe einen logistischen Regressionsklassifikator. Beim normalen Batch-Lernen hätte ich einen Regularizer-Term, um eine Überanpassung zu verhindern und meine Gewichte klein zu halten. Ich würde auch meine Funktionen normalisieren und skalieren. In einer Online-Lernumgebung erhalte ich einen kontinuierlichen Datenstrom. Ich führe mit jedem Beispiel ein Gefälle-Update durch …

1
Was ist die genaue Definition eines „Heywood-Falls“?
Ich habe den Begriff "Heywood-Fall" informell verwendet, um Situationen zu bezeichnen, in denen eine online durchgeführte, "endliche Antwort" iterativ aktualisierte Schätzung der Varianz aufgrund von numerischen Genauigkeitsproblemen negativ wurde. (Ich verwende eine Variante der Welford-Methode, um Daten hinzuzufügen und ältere Daten zu entfernen.) Ich hatte den Eindruck, dass sie auf …

2
Online-Schätzung von Quartilen ohne Speicherung von Beobachtungen
Ich muss Quartile (Q1, Median und Q3) in Echtzeit mit einer großen Datenmenge berechnen, ohne die Beobachtungen zu speichern. Ich habe zuerst den P-Quadrat-Algorithmus (Jain / Chlamtac) ausprobiert, war aber nicht zufrieden damit (etwas zu viel CPU-Auslastung und nicht überzeugt von der Genauigkeit zumindest meines Datensatzes). Ich verwende jetzt den …

5
Rekursiver (online) regularisierter Algorithmus der kleinsten Quadrate
Kann mich jemand auf einen (rekursiven) Online-Algorithmus für die Tikhonov-Regularisierung (regularisierte kleinste Quadrate) hinweisen? In einer Offline-Einstellung würde ich Verwendung meines ursprünglichen Datensatzes berechnen, wobei unter Verwendung der n-fachen Kreuzvalidierung gefunden wird. Ein neuer Wert kann für ein gegebenes x mit y = x ^ T \ hat \ beta …

1
Online skalierbare statistische Methoden
Dies wurde durch eine effiziente lineare Online-Regression inspiriert , die ich sehr interessant fand. Gibt es Texte oder Ressourcen, die für statistische Berechnungen in großem Maßstab vorgesehen sind, bei denen die Datenmengen zu groß sind, um in den Hauptspeicher zu passen, und die möglicherweise zu unterschiedlich sind, um eine effektive …

1
Modellauswahl beim Offline- oder Online-Lernen
Ich habe in letzter Zeit versucht, mehr über Online-Lernen zu lernen (es ist absolut faszinierend!), Und ein Thema, das ich nicht richtig verstehen konnte, ist, wie man über Modellauswahl in Offline- oder Online-Kontexten nachdenkt. Insbesondere nehmen wir trainieren ein Klassifikator offline, basierend auf einer festen Datensatz D . Wir schätzen …

2
Inkrementelle Gaußsche Prozessregression
Ich möchte eine inkrementelle Gaußsche Prozessregression mithilfe eines Schiebefensters über den Datenpunkten implementieren, das nacheinander über einen Stream ankommt. Lassen die Dimensionalität des Eingangsraums bezeichnen. Jeder Datenpunkt hat also Anzahl von Elementen.dddxixix_iddd Sei die Größe des Schiebefensters.nnn Um Vorhersagen zu treffen, muss ich die Inverse der Grammmatrix berechnen , wobei …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.