Beispiele: Ich habe einen Satz in der Stellenbeschreibung: "Java Senior Engineer in UK". Ich möchte ein Deep-Learning-Modell verwenden, um es als zwei Kategorien vorherzusagen: English und IT jobs. Wenn ich ein traditionelles Klassifizierungsmodell verwende, kann es nur 1 Etikett mit softmaxFunktion auf der letzten Ebene vorhersagen . Somit kann ich …
Mein Lehrbuch listet die IDF als wol o g( 1 + N.nt)log(1+Nnt)log(1+\frac{N}{n_t}) : Anzahl der DokumenteN.NN : Anzahl der Dokumente, die den Begriff t enthaltenntntn_tttt Wikipedia listet diese Formel als eine geglättete Version des aktuellen . Das verstehe ich: es reicht vonlog(N.log(Nnt)log(Nnt)log(\frac{N}{n_t})bis∞,was intuitiv erscheint. Aberlog(1+N.log(NN)=0log(NN)=0log(\frac{N}{N})=0∞∞\inftygeht vonlog(1+1)nach∞,was so seltsam erscheint ... …
Ich arbeite an einem prädiktiven Kostenmodell, bei dem das Alter des Patienten (eine in Jahren gemessene ganzzahlige Größe) eine der Prädiktorvariablen ist. Ein starker nichtlinearer Zusammenhang zwischen Alter und Risiko eines Krankenhausaufenthaltes ist offensichtlich: Ich denke über einen bestraften Regressionsglättungs-Spline für das Alter des Patienten nach. Gemäß The Elements of …
Ich möchte die Werte herausfinden, die (x, y)beim Plotten plot(b, seWithMean=TRUE)im mgcv- Paket verwendet werden. Weiß jemand, wie ich diese Werte extrahieren oder berechnen kann? Hier ist ein Beispiel: library(mgcv) set.seed(0) dat <- gamSim(1, n=400, dist="normal", scale=2) b <- gam(y~s(x0), data=dat) plot(b, seWithMean=TRUE)
TLDR: Haben Dünnplatten-Regressionssplines eine probabilistische / Bayes'sche Interpretation? Bei gegebenen Eingabe-Ausgabe-Paaren ist ; Ich möchte eine Funktion wie folgt schätzen: wobei eine Kernfunktion ist und ein Merkmalsvektor der Größe . Die Koeffizienten und können durch Lösen von wobei Die Zeilen von \ Phi sind gegeben durch(xi,yi)(xi,yi)(x_i,y_i)i=1,...,ni=1,...,ni=1,...,nf(⋅)f(⋅)f(\cdot)f(x)≈u(x)=ϕ(xi)Tβ+∑i=1nαik(x,xi),f(x)≈u(x)=ϕ(xi)Tβ+∑i=1nαik(x,xi),\begin{equation}f(x)\approx u(x)=\phi(x_i)^T\beta +\sum_{i=1}^n \alpha_i k(x,x_i),\end{equation}k(⋅,⋅)k(⋅,⋅)k(\cdot,\cdot)ϕ(xi)ϕ(xi)\phi(x_i)m<nm<nm<nαiαi\alpha_iβiβi\beta_iminα∈Rn,β∈Rm1n∥Y−Φβ−Kα∥2Rn+λαTKα,minα∈Rn,β∈Rm1n‖Y−Φβ−Kα‖Rn2+λαTKα,\begin{equation} …
Die Daten bestehen aus optischen Spektren (Lichtintensität gegen Frequenz), die zu unterschiedlichen Zeiten aufgenommen wurden. Die Punkte wurden in einem regelmäßigen Raster in x (Zeit), y (Frequenz) erfasst. Um die zeitliche Entwicklung bei bestimmten Frequenzen zu analysieren (ein schneller Anstieg, gefolgt von einem exponentiellen Abfall), möchte ich einen Teil des …
Angenommen, ich habe eine zentrierte Datenmatrix mit SVD .n×mn×mn \times mAAAA=UΣVTA=UΣVTA = U \Sigma V^{T} Zum Beispiel Spalten (Messungen), die Spektren mit verschiedenen Frequenzen sind. Die Matrix ist zentriert, sodass der Mittelwert der Zeilen der Matrix abgezogen wird. Dies dient zur Interpretation der linken Singularvektoren als Hauptkomponenten.m=50m=50m=50n=100n=100n=100 Ich bin daran …
Ich stehe vor einer posterioren Verteilung in einer MCMC- Anwendung, die darauf abzielt, eine nicht beobachtbare Variable bei einer beobachteten Reihe y = \ {y_t \} ^ T_ {t = abzutasten 0} .x={xt}Tt=0x={xt}t=0Tx=\{x_t\}_{t=0}^{T}y={yt}Tt=0y={yt}t=0Ty=\{y_t\}^T_{t=0} Die bedingten Posterioren lauten jedoch p(xt|yt+1,yt,yt−1,xt−1,xt+1,Θ),p(xt|yt+1,yt,yt−1,xt−1,xt+1,Θ),p(x_t | y_{t+1}, y_t, y_{t-1} ,x_{t-1}, x_{t+1}, \Theta), wobei ΘΘ\Theta a ist …
Ich habe Zeitreihendaten von verschiedenen Häusern. Angenommen, es handelt sich um Stromverbrauchsdaten. Jetzt möchte ich die Häuser nach einem ähnlichen Stromverbrauchsmuster gruppieren. Zu den verschiedenen Entfernungsmetriken, die ich mir vorstellen kann, um die Ähnlichkeit zu messen, gehören: Euklidische Entfernung DTW- Entfernung Frechet Entfernung Mit euklidischer Distanz fand ich einen Ausreißer …
Ich habe eine etwas laute Zeitreihe, die auf verschiedenen Ebenen schwebt. Zum Beispiel die folgenden Daten: Ich habe die durchgezogenen Liniendaten zur Verfügung und möchte eine Schätzung für die gestrichelte Linie erhalten. Es sollte stückweise konstant sein. Welche Algorithmen sollten Sie hier ausprobieren? Meine bisherigen Ideen drehen sich um 0-Grad-P-Splines …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.