Wiederholtes Zurückhalten von Teilmengen der Daten während der Modellanpassung, um die Modellleistung für die Teilmengen der zurückgehaltenen Daten zu quantifizieren.
Ich habe an diesem Austausch eine heuristische Methode zur Schätzung von Gamma für den RBF-Kernel in SVMs gelesen. Ich habe mich gefragt, ob jemand es mir vielleicht etwas genauer erklären kann. Ich glaube, Sie wählen 1000 (oder eine große Anzahl) von Datenpunktpaaren aus dem Datensatz aus und berechnen dann die …
Ich arbeite an einem ANN-basierten Prognosemodell für eine finanzielle Zeitreihe. Ich verwende eine 5-fache Kreuzvalidierung und die durchschnittliche Leistung ist so. Die Leistung in der letzten Falte (die Iteration, bei der das letzte Segment nicht trainiert und zur Validierung verwendet wird) ist besser als der Durchschnitt. Ist dies ein Zufall …
Ich habe stundenlang online danach gesucht, aber keiner der Online-Beiträge ist das, wonach ich suche. Meine Frage ist sehr einfach in SAS Proc Mixed Procedure zu implementieren, aber ich bin nicht sicher, wie ich es in lme- und / oder lmer-Paketen machen soll. Angenommen, ich habe ein Modell, , wobei …
Meine Frage betrifft die Kreuzvalidierung, wenn es viel mehr Variablen als Beobachtungen gibt. Um Ideen zu fixieren, schlage ich vor, mich auf den Klassifizierungsrahmen in sehr hohen Dimensionen zu beschränken (mehr Merkmale als Beobachtung). Problem: Angenommen, Sie haben für jede Variable ein Maß für die Wichtigkeit als das Interesse des …
Ich bin mit der "regulären" Kreuzvalidierung vertraut, aber jetzt möchte ich Zeitreihenvorhersagen treffen, während ich die Kreuzvalidierung mit einer einfachen linearen Regressionsfunktion verwende. Ich schreibe ein einfaches Beispiel auf, um meine beiden Fragen zu klären: eine zum Zug / Test-Split, eine Frage zum Trainieren / Testen von Modellen, wenn das …
Ich bin ein bisschen beunruhigt und verwirrt über die Idee, wie die Technik des frühen Stoppens definiert wird. Wenn Sie sich Wikipedia ansehen , ist es wie folgt definiert: Teilen Sie die Trainingsdaten in einen Trainingssatz und einen Validierungssatz auf, z. B. im Verhältnis 2 zu 1. Trainieren Sie nur …
Ich habe irgendwo festgestellt, dass der Testsatz nicht als Validierungssatz verwendet werden darf. Warum? Der Validierungssatz wird angewendet, wenn die Modellparameter festgelegt sind und das Lernen nur durch Backprop auf dem Trainingsstapel erfolgt. Warum kann ich Testdaten nicht als Validierungsdaten verwenden?
Ich habe eine ganze Reihe von Beiträgen zum Caret- Paket gelesen und interessiere mich speziell für die Zugfunktion . Ich bin mir jedoch nicht ganz sicher, ob ich richtig verstanden habe, wie die Zugfunktion funktioniert. Um meine aktuellen Gedanken zu veranschaulichen, habe ich ein kurzes Beispiel zusammengestellt. Zunächst wird ein …
Ich versuche, die KNN-Methode für die binäre Klassifizierung zu verwenden. Wenn ich versuche, den besten 'k'-Parameter zu finden (die Anzahl der Nachbarn, die der Algorithmus betrachtet), trainiere ich ein Modell in meinem Trainingssatz und überprüfe seine Genauigkeit in einem separaten Validierungssatz, den ich mit meinen Daten erhalten habe. Dieser Validierungssatz …
Wenn ich in einer Regressionseinstellung viele Zufallsmodelle (ohne Berücksichtigung der Daten) generiere, indem ich einfach zufällig Koeffizientenwerte zuweise und diese Modelle dann über den Datensatz mit einer Fehlermetrik auswerte und das beste Modell basierend auf dieser Fehlermetrik auswähle, würde ich trotzdem ausführen in Überanpassung? Irgendwann werden wir die OLS-Lösung haben …
Ich dachte, die K-fache Kreuzvalidierung besteht aus den folgenden Schritten. Teilen Sie Daten zufällig in Blöcke auf.KKK Auf Stücke passen .K−1K−1K-1 Sagen Sie den verbleibenden Teil voraus. Halten Sie Vorhersagen. Wiederholen Sie 2-3 für alle verbleibenden Kombinationen der Chunks, bei denen 1 Chunk weggelassen wird .K−1K−1K-1KKK Bewerten Sie die Verluststatistik, …
Betrachten Sie die elastische Netzregression mit einer glmnetähnlichen Parametrisierung der VerlustfunktionIch habe einen Datensatz mit n \ ll p (44 bzw. 3000) und verwende eine wiederholte 11-fache Kreuzvalidierung, um die optimalen Regularisierungsparameter \ alpha und \ lambda auszuwählen . Normalerweise würde ich einen quadratischen Fehler als Leistungsmetrik für den Testsatz …
Ich bin mir der Vorteile der k-fachen (und ausgelassenen) Kreuzvalidierung sowie der Vorteile der Aufteilung Ihres Trainingssatzes zur Erstellung eines dritten Holdout-Validierungssatzes bewusst, den Sie zur Bewertung verwenden Modellleistung basierend auf der Auswahl von Hyperparametern, sodass Sie diese optimieren und optimieren und die besten auswählen können, die schließlich am realen …
Ich versuche, eine SVM an meine Daten anzupassen. Mein Datensatz enthält 3 Klassen und ich führe eine 10-fache Kreuzvalidierung durch (in LibSVM): ./svm-train -g 0.5 -c 10 -e 0.1 -v 10 training_data Die Hilfe lautet dabei: -c cost : set the parameter C of C-SVC, epsilon-SVR, and nu-SVR (default 1) …
Bei der linearen Regression von Grat und Lasso besteht ein wichtiger Schritt darin, den Abstimmungsparameter Lambda zu wählen. Oft verwende ich die Rastersuche auf der Protokollskala von -6-> 4, sie funktioniert gut auf Grat, aber auf Lasso sollte ich die Reihenfolge berücksichtigen der Größe der Ausgabe y? Wenn die Ausgabe …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.