Die Details der Google Prediction-API finden Sie auf dieser Seite . Ich kann jedoch keine Details zu den Vorhersagealgorithmen finden, die hinter der API ausgeführt werden. Bisher habe ich festgestellt, dass Sie damit Ihre Vorverarbeitungsschritte im PMML-Format bereitstellen können.
Ich suche nach Tools, mit denen ich und mein Team Trainingssätze kommentieren können. Ich arbeite in einer Umgebung mit großen Datenmengen, von denen einige un- oder halbstrukturiert sind. In vielen Fällen gibt es Registrierungen, die helfen, eine fundierte Wahrheit zu finden. In vielen Fällen wird jedoch ein kuratierter Satz benötigt, …
Ich versuche, ein Regressionsmodell zu erstellen, das die Dauer einer Aufgabe vorhersagt. Die Trainingsdaten, die ich habe, bestehen aus ungefähr 40.000 erledigten Aufgaben mit diesen Variablen: Wer hat die Aufgabe ausgeführt (~ 250 verschiedene Personen) Für welchen Teil (Teilprojekt) des Projekts wurde die Aufgabe ausgeführt (~ 20 verschiedene Teile)? Die …
Ich versuche zu lernen, wie LSTMNetzwerke funktionieren, und selbst wenn ich die Grundlagen verstehe, sind mir die Details der internen Struktur nicht klar. Auf diesem Blog- Link habe ich dieses Schema einer LSTMArchitektur gefunden Wo anscheinend jeder Kreis einer einzelnen LSTMEinheit wie dieser entsprechen sollte Ist das richtig? Ist jede …
Ich möchte das Knn-Entfernungsdiagramm verwenden, um herauszufinden, welchen EPS-Wert ich für den DBSCAN-Algorithmus wählen soll. Basierend auf dieser Seite: Die Idee ist, den Durchschnitt der Entfernungen jedes Punktes zu seinen k nächsten Nachbarn zu berechnen. Der Wert von k wird vom Benutzer angegeben und entspricht MinPts. Als nächstes werden diese …
Angenommen, ich habe gemischte Daten und (Python-) Code, der PCA (Hauptkomponentenanalyse) für kontinuierliche Prädiktoren und MCA (Multiple Correspondence Analysis) für nominale Prädiktoren ausführen kann. Ist es möglich, Ergebnisse von PCA und MCA in einem zu kombinieren?
Ich habe ein Klassenungleichgewicht im Verhältnis 1:15, dh eine sehr niedrige Ereignisrate. Um die Abstimmungsparameter von GBM in Scikit Learn auszuwählen, möchte ich Kappa anstelle der F1-Punktzahl verwenden. Mein Verständnis ist, dass Kappa eine bessere Metrik als die F1-Punktzahl für das Klassenungleichgewicht ist. Aber ich konnte Kappa als Evaluierungsmetrik in …
Ich habe die Smote-Technik verwendet, um meinen Datensatz zu überabtasten, und jetzt habe ich einen ausgeglichenen Datensatz. Das Problem, mit dem ich konfrontiert war, ist, dass die Leistungsmetriken; Präzision, Rückruf, f1-Messung und Genauigkeit im unausgeglichenen Datensatz werden besser ausgeführt als bei einem ausgeglichenen Datensatz. Mit welcher Messung kann ich zeigen, …
Ich versuche, ein Modell in Keras zu trainieren, und verwende ModelCheckpoint , um das beste Modell gemäß einer überwachten Validierungsmetrik (in meinem Fall dem Jaccard-Index ) zu speichern . Während ich sehe, dass sich das Modell im Tensorboard verbessert, funktioniert es überhaupt nicht, wenn ich versuche, die Gewichte zu laden …
Was ist der beste Weg, um die Ansätze zu kategorisieren, die entwickelt wurden, um das Problem der Ungleichgewichtsklassen zu lösen? Dieser Artikel kategorisiert sie in: Vorverarbeitung: umfasst Oversampling, Undersampling und Hybridmethoden, Kostensensitives Lernen: Umfasst direkte Methoden und Meta-Lernen, das letztere weiter in Schwellenwerte und Stichproben unterteilt. Ensemble-Techniken: Umfasst kostensensitive Ensembles …
Ich habe Daten für die seitliche Position jedes Fahrzeugs über die Zeit und die Fahrspurnummer, wie in diesen 3 Darstellungen im Bild und in den Beispieldaten unten gezeigt. > a Frame.ID xcoord Lane 1 452 27.39400 3 2 453 27.38331 3 3 454 27.42999 3 4 455 27.46512 3 5 …
Ich würde gerne wissen, ob Sie Leute einige gute Tutorials (schnell und unkompliziert) über Themenmodelle und LDA haben, die intuitiv lehren, wie man einige Parameter einstellt, was sie bedeuten und wenn möglich, mit einigen realen Beispielen.
Als ich die Anzahl der Bäume erhöhe in scikit lernen ist GradientBoostingRegressor, erhalte ich negative Prognosen, auch wenn es in meiner Ausbildung oder Testsatz keine negativen Werte sind. Ich habe ungefähr 10 Funktionen, von denen die meisten binär sind. Einige der Parameter, die ich eingestellt habe, waren: die Anzahl der …
Ich habe zwei Datensätze A und B, die hinsichtlich Anzahl der Spalten, Name der Spalten und Werte genau gleich sind. Der einzige Unterschied ist die Reihenfolge dieser Spalten. Anschließend trainiere ich das LightGBM-Modell für jeden der beiden Datensätze mit den folgenden Schritten Teilen Sie jeden Datensatz in Training und Test …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.