Ich untersuche verschiedene Arten von Analysebaumstrukturen. Die beiden weit verbreiteten Analysebaumstrukturen sind a) Wahlkreisbasierter Analysebaum und b) Abhängigkeitsbasierte Analysebaumstrukturen. Ich kann beide Arten von Analysebaumstrukturen mit dem Stanford NLP-Paket generieren. Ich bin mir jedoch nicht sicher, wie ich diese Baumstrukturen für meine Klassifizierungsaufgabe verwenden soll. Zum Beispiel: Wenn ich eine …
Ich lese eine Präsentation und empfehle, keine Kodierung wegzulassen, aber mit einer heißen Kodierung ist es in Ordnung. Ich dachte, sie wären beide gleich. Kann jemand beschreiben, was die Unterschiede zwischen ihnen sind?
Ich habe versucht, Feature-Wichtigkeiten aus zufälligen Wäldern zu verwenden, um eine empirische Feature-Auswahl für ein Regressionsproblem durchzuführen, bei dem alle Features kategorisch sind und viele von ihnen viele Ebenen haben (in der Größenordnung von 100-1000). Da bei der One-Hot-Codierung für jede Ebene eine Dummy-Variable erstellt wird, gelten die Feature-Wichtigkeiten für …
Ich habe die Feature-Wichtigkeiten in zufälligen Wäldern mit Scikit-Learn aufgezeichnet . Wie kann ich die Plotinformationen zum Entfernen von Features verwenden, um die Vorhersage mithilfe zufälliger Gesamtstrukturen zu verbessern? Dh wie kann man anhand der Plotinformationen erkennen, ob ein Feature nutzlos ist oder die Leistung der zufälligen Gesamtstrukturen noch schlimmer …
Ich erstelle Prototypen für eine Anwendung und benötige ein Sprachmodell, um die Ratlosigkeit einiger generierter Sätze zu berechnen. Gibt es ein geschultes Sprachmodell in Python, das ich problemlos verwenden kann? So etwas Einfaches wie model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert …
Ich baue oft ein Modell (Klassifizierung oder Regression) auf, in dem ich einige Prädiktorvariablen habe, bei denen es sich um Sequenzen handelt, und ich habe versucht, technische Empfehlungen zu finden, um sie bestmöglich zusammenzufassen und als Prädiktoren in das Modell aufzunehmen. Angenommen, es wird ein Modell erstellt, um vorherzusagen, ob …
Wenn ich versuche, zB eine Klassifizierung vorzunehmen, gehe ich derzeit zu Probieren Sie zuerst verschiedene Algorithmen aus und vergleichen Sie sie Führen Sie die Merkmalsauswahl für den besten Algorithmus aus 1 oben durch Passen Sie die Parameter mithilfe der ausgewählten Funktionen und Algorithmen an Ich kann mich jedoch oft nicht …
Das folgende Diagramm zeigt Koeffizienten, die mit linearer Regression erhalten wurden (mit mpgals Zielvariable und allen anderen als Prädiktoren). Für mtcars-Dataset ( hier und hier ) mit und ohne Skalierung der Daten: Wie interpretiere ich diese Ergebnisse? Die Variablen hpund dispsind nur dann von Bedeutung, wenn die Daten skaliert sind. …
Geschlossen . Diese Frage muss fokussierter sein . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so, dass sie sich nur auf ein Problem konzentriert, indem Sie diesen Beitrag bearbeiten . Geschlossen vor 5 Jahren . Es scheint, als ob in den meisten Sprachen …
Es gibt verschiedene Ansätze zur Merkmalsauswahl / Variablenauswahl (siehe zum Beispiel Guyon & Elisseeff, 2003 ; Liu et al., 2010 ): Filtermethoden (z. B. korrelationsbasiert, entropiebasiert, zufällige Waldbedeutung basierend), Wrapper-Methoden (z. B. Vorwärtssuche, Bergsteigensuche) und eingebettete Methoden, bei denen die Merkmalsauswahl Teil des Modelllernens ist. Viele veröffentlichte Algorithmen sind auch …
Eine der Methoden zum Auswählen einer Teilmenge Ihrer verfügbaren Merkmale für Ihren Klassifizierer besteht darin, sie nach einem Kriterium (z. B. Informationsgewinn) zu ordnen und dann die Genauigkeit mithilfe Ihres Klassifikators und einer Teilmenge der eingestuften Merkmale zu berechnen. Wenn Ihre Features beispielsweise A, B, C, D, Ewie folgt sind …
Ich suche eine Website oder ein Buch, auf der Schritt für Schritt einige praktische Beispiele gegeben werden, in denen erklärt wird, wie sie die relevanten Funktionen, das Modellauswahlverfahren usw. auswählen.
Kann jemand bitte vorschlagen, was der richtige Schritt ist, um korrelierte Variablen vor dem Feature-Engineering oder nach dem Feature-Engineering zu entfernen?
Ich habe Datensätze, die unter anderem GPS-Koordinaten (Längen- und Breitengrad) enthalten. Ich möchte diese Datensätze verwenden, um Probleme zu untersuchen wie: (1) Berechnen der ETA, um zwischen Start- und Endpunkten zu fahren; und (2) Schätzen des Ausmaßes der Kriminalität für einen bestimmten Punkt. Ich möchte ein lineares Regressionsmodell verwenden. Kann …
Angenommen, wir prognostizieren den Verkauf eines Geschäfts und meine Trainingsdaten weisen zwei Funktionen auf: Eine über den Ladenverkauf mit den Daten (das Feld "Laden" ist nicht eindeutig) Eine über die Geschäftstypen (das Feld "Geschäft" ist hier eindeutig) Die Matrix würde also ungefähr so aussehen: +-------+-----------+------------+---------+-----------+------+-------+--------------+ | Store | DayOfWeek | …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.