Ich lese darüber SVMund habe mich dem Punkt gestellt, dass nicht kernelisierte SVMsnichts anderes als lineare Trennzeichen sind. Ist daher der einzige Unterschied zwischen einer SVMund einer logistischen Regression das Kriterium für die Wahl der Grenze? Anscheinend SVMwählt der maximale Margenklassifikator und die logistische Regression ist diejenige, die den cross-entropyVerlust …
Nachdem ich mein Vorhersagemodell mit Random Forest entwickelt habe, erhalte ich die folgenden Metriken: Train Accuracy :: 0.9764634601043997 Test Accuracy :: 0.7933284397683713 Confusion matrix [[28292 1474] [ 6128 889]] Dies ist das Ergebnis dieses Codes: training_features, test_features, training_target, test_target, = train_test_split(df.drop(['bad_loans'], axis=1), df['target'], test_size = .3, random_state=12) clf = RandomForestClassifier() …
Ich arbeite mit einem Datensatz mit einer großen Anzahl von kategorialen Merkmalen (> 80%), die eine kontinuierliche Zielvariable (dh Regression) vorhersagen. Ich habe ziemlich viel darüber gelesen, wie man mit kategorialen Merkmalen umgeht. Und erfuhr , dass One-Hot - Codierung ich in Vergangenheit verwendet habe vor allem sehr schlechte Idee …
Was ist der Unterschied in R in xgboost zwischen binär: logistisch und reg: logistisch? Ist es nur in Bewertungsmetrik? Wenn ja, wie verhält sich RMSE zur binären Klassifizierung zur Fehlerrate? Ist die Beziehung zwischen den Metriken mehr oder weniger monoton, sollte sich die Ausgabe der Abstimmung auf eine Metrik zwischen …
Ist es möglich, BERT für die Aufgabe der Vorhersage des nächsten Wortes zu verwenden, da es bidirektional ist (einen bidirektionalen Transformator verwendet)? Wenn ja, was muss optimiert werden?
"Ein häufiger Fehler, den ich machen würde, ist das Hinzufügen einer Nichtlinearität zu meiner Protokollausgabe." Was bedeutet der Begriff "logit" hier oder was bedeutet er?
Was bedeutet "Baseline" im Kontext von maschinellem Lernen und Datenwissenschaft? Jemand hat mir geschrieben: Hinweis: Eine geeignete Basislinie ergibt einen RMSE von ungefähr 200. Ich verstehe das nicht. Bedeutet er, dass es gut ist, wenn mein Vorhersagemodell für die Trainingsdaten einen RMSE unter 500 aufweist? Und was könnte ein "Baseline-Ansatz" …
Wenn Sie das word2vec-Modell trainieren (z. B. mit gensim), geben Sie eine Liste mit Wörtern / Sätzen an. Es scheint jedoch keine Möglichkeit zu geben, Gewichte für die Wörter anzugeben, die beispielsweise mit TF-IDF berechnet wurden. Ist es üblich, die Wortvektor-Einbettungen mit dem zugehörigen TF-IDF-Gewicht zu multiplizieren? Oder kann word2vec …
Ich habe zwei DataFrames (Action, Comedy). Aktion enthält zwei Spalten (Jahr, Bewertung) Bewertungsspalten enthalten durchschnittliche Bewertung in Bezug auf das Jahr. Comedy Dataframe enthält dieselben zwei Spalten mit unterschiedlichen Mittelwerten. Ich füge beide Datenrahmen in einem total_year Datenrahmen zusammen Ausgabe von total_year Jetzt möchte ich total_year in einem Liniendiagramm darstellen, …
Ich versuche, den Policy-Gradient- Ansatz zur Lösung des Cartpole- Problems zu verstehen . Bei diesem Ansatz drücken wir den Gradienten des Verlusts für jeden Parameter unserer Richtlinie als Erwartung der Summe der Gradienten unseres Richtliniengradienten für alle Aktionen in einer Sequenz aus, gewichtet mit der Summe der abgezinsten Belohnungen in …
Das folgende Diagramm zeigt Koeffizienten, die mit linearer Regression erhalten wurden (mit mpgals Zielvariable und allen anderen als Prädiktoren). Für mtcars-Dataset ( hier und hier ) mit und ohne Skalierung der Daten: Wie interpretiere ich diese Ergebnisse? Die Variablen hpund dispsind nur dann von Bedeutung, wenn die Daten skaliert sind. …
Geschlossen . Diese Frage muss fokussierter sein . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so, dass sie sich nur auf ein Problem konzentriert, indem Sie diesen Beitrag bearbeiten . Geschlossen vor 5 Jahren . Es scheint, als ob in den meisten Sprachen …
Ich habe ein Klassifizierungsproblem mit kategorialen und numerischen Daten. Das Problem, mit dem ich konfrontiert bin, ist, dass meine kategorialen Daten nicht festgelegt sind. Dies bedeutet, dass der neue Kandidat, dessen Bezeichnung ich vorhersagen möchte, möglicherweise eine neue Kategorie hat, die zuvor nicht beobachtet wurde. Wenn zum Beispiel meine kategorialen …
Ich verwende XGboost , um eine Zielvariable mit zwei Klassen für Versicherungsansprüche vorherzusagen. Ich habe ein Modell (Training mit Kreuzvalidierung, Optimierung von Hyperparametern usw.), das ich auf einem anderen Datensatz ausführe. Meine Frage ist : Gibt es eine Möglichkeit zu wissen, warum ein bestimmter Anspruch auf eine Klasse betroffen ist, …
Ich habe eine praktische Frage zum Feature Engineering ... Ich möchte die Immobilienpreise mithilfe der logistischen Regression vorhersagen und habe eine Reihe von Funktionen einschließlich der Postleitzahl verwendet. Wenn ich dann die Wichtigkeit der Funktionen überprüfe, stelle ich fest, dass Zip eine ziemlich gute Funktion ist. Deshalb habe ich beschlossen, …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.