Ich habe mit zufälligen Wäldern für die Regression herumgespielt und habe Schwierigkeiten, genau herauszufinden, was die beiden wichtigen Maße bedeuten und wie sie interpretiert werden sollten. Die importance()Funktion gibt für jede Variable zwei Werte an: %IncMSEund IncNodePurity. Gibt es einfache Interpretationen für diese 2 Werte? Ist dies IncNodePurityinsbesondere einfach der …
Ich bin ein bisschen ein Nihilist geworden, wenn es um Rangfolgen mit variabler Wichtigkeit geht (im Kontext von multivariaten Modellen aller Art). Oft werde ich im Verlauf meiner Arbeit gebeten, einem anderen Team zu helfen, ein Ranking mit variabler Wichtigkeit zu erstellen, oder ein Ranking mit variabler Wichtigkeit aus meiner …
Was ist die Grenze für die Anzahl unabhängiger Variablen, die in eine Mehrfachregressionsgleichung eingegeben werden können? Ich habe 10 Prädiktoren, die ich im Hinblick auf ihren relativen Beitrag zur Ergebnisvariablen untersuchen möchte. Sollte ich eine Bonferroni-Korrektur verwenden, um mehrere Analysen anzupassen?
Gibt es eine Möglichkeit zu bestimmen, welche Merkmale / Variablen des Datensatzes innerhalb einer k-means Cluster-Lösung am wichtigsten / dominantesten sind?
Ich möchte das Lasso als Methode zur Auswahl von Merkmalen und zur Anpassung eines Vorhersagemodells an ein binäres Ziel verwenden. Im Folgenden ist ein Code aufgeführt, mit dem ich die Methode mit regulierter logistischer Regression ausprobiert habe. Meine Frage ist, dass ich eine Gruppe von "signifikanten" Variablen erhalte, aber bin …
Ich habe einen logistischen Regressionsklassifikator erstellt, der für meine Daten sehr genau ist. Jetzt möchte ich besser verstehen, warum es so gut funktioniert. Im Einzelnen möchte ich klassifizieren, welche Features den größten Beitrag leisten (welche Features am wichtigsten sind) und im Idealfall quantifizieren, wie viel jedes Feature zur Genauigkeit des …
Ich versuche zu verstehen, wie ich die Feature-Wichtigkeit einer kategorialen Variablen ermitteln kann, die in Dummy-Variablen zerlegt wurde. Ich benutze scikit-learn, das kategoriale Variablen für Sie nicht so behandelt, wie es R oder H2O tun. Wenn ich eine kategoriale Variable in Dummy-Variablen zerlege, erhalte ich separate Feature-Wichtigkeiten pro Klasse in …
Ich habe gerade einen Artikel gelesen, in dem die Autoren eine multiple Regression mit zwei Prädiktoren durchgeführt haben. Der gesamte r-Quadrat-Wert betrug 0,65. Sie stellten eine Tabelle zur Verfügung, die das Quadrat zwischen den beiden Prädiktoren aufteilte. Die Tabelle sah so aus: rsquared beta df pvalue whole model 0.65 NA …
Ich habe einen Forschungsstudenten mit einem bestimmten Problem beraten und wollte unbedingt die Meinung anderer auf dieser Website einholen. Kontext: Der Forscher hatte drei Arten von Prädiktorvariablen. Jeder Typ enthielt eine andere Anzahl von Prädiktorvariablen. Jeder Prädiktor war eine kontinuierliche Variable: Soziales: S1, S2, S3, S4 (dh vier Prädiktoren) Kognitiv: …
Meine Frage: Warum werden in zufälligen Gesamtstrukturen zufällige Teilmengen von Features für die Aufteilung auf Knotenebene in jedem Baum berücksichtigt, anstatt auf Baumebene ? Hintergrund: Dies ist so etwas wie eine historische Frage. Tin Kam Ho veröffentlichte diesen Aufsatz über die Konstruktion von "Entscheidungswäldern", indem er 1998 zufällig eine Teilmenge …
Angenommen, ein logistisches Regressionsmodell wird verwendet, um vorherzusagen, ob ein Online-Käufer ein Produkt kaufen wird (Ergebnis: Kauf), nachdem er auf eine Reihe von Online-Anzeigen geklickt hat (Prädiktoren: Ad1, Ad2 und Ad3). Das Ergebnis ist eine binäre Variable: 1 (gekauft) oder 0 (nicht gekauft). Die Prädiktoren sind auch binäre Variablen: 1 …
Ich frage mich, ob es eine gute Idee ist, diese Variablen mit einem negativen Variablen-Wichtigkeitswert ("% IncMSE") in einem Regressionskontext zu entfernen. Und wenn es mir eine bessere Vorhersage gibt? Was denkst du?
Angenommen, ich habe eine Stichprobe von Häufigkeiten von 4 möglichen Ereignissen: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 und ich habe die erwarteten Wahrscheinlichkeiten, dass meine Ereignisse eintreten: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Mit der Summe der beobachteten …
Ich habe ein einfaches lineares Regressionsmodell. Was ich berechnen möchte, ist, wie "wichtig" jede meiner Eingabevariablen ist, dh um eine Aussage wie diese zu machen: "60% der Vorhersagekraft in diesem Modell stammt von der Variablen var1, wobei var2 und var3 30% bzw. 10% haben." Was muss ich tun, um diese …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.