Gibt es eine R-Random-Forest-Implementierung, die mit sehr spärlichen Daten gut funktioniert? Ich habe Tausende oder Millionen von booleschen Eingabevariablen, aber nur Hunderte oder so werden für ein bestimmtes Beispiel WAHR sein. Ich bin relativ neu in R und habe festgestellt, dass es ein 'Matrix'-Paket für den Umgang mit spärlichen Daten …
Ich habe ein Multi-Output-Regressionsproblem mit Eingabe-Features und Ausgaben. Die Ausgänge haben eine komplexe, nichtlineare Korrelationsstruktur.d ydxdxd_xdydyd_y Ich möchte zufällige Wälder verwenden, um die Regression durchzuführen. Zufällige Wälder für die Regression funktionieren, soweit ich das beurteilen kann, nur mit einer einzigen Ausgabe, daher müsste ich d_ydydyd_y zufällige Wälder trainieren - eine …
Ich bin mir nicht einmal sicher, ob die Frage wirklich Sinn macht, aber ich glaube, ich habe einige Titel von Artikeln gesehen, in denen zufällige Gesamtstrukturen mit zufälligen Effekten vorgeschlagen wurden. Ist das in R möglich?
Das randomForest-Paket von R kann nicht mit Faktoren mit mehr als 32 Ebenen umgehen. Bei mehr als 32 Ebenen wird eine Fehlermeldung ausgegeben: Kann keine kategorialen Prädiktoren mit mehr als 32 Kategorien verarbeiten. Aber die Daten, die ich habe, haben mehrere Faktoren. Einige von ihnen haben 1000+ Levels und einige …
Diese Frage wurde von Stack Overflow migriert, da sie über Cross Validated beantwortet werden kann. Vor 5 Jahren migriert . Ich habe andere Themen zu partiellen Abhängigkeitsdiagrammen durchgelesen und die meisten davon beziehen sich darauf, wie Sie sie tatsächlich mit verschiedenen Paketen plotten, und nicht darauf, wie Sie sie genau …
Ich las den Bericht über die Siegerlösung eines Kaggle-Wettbewerbs ( Malware Classification ). Der Bericht ist in diesem Forumsbeitrag zu finden . Das Problem war ein Klassifizierungsproblem (neun Klassen, die Metrik war der logarithmische Verlust) mit 10000 Elementen in der Zugmenge, 10000 Elementen in der Testmenge. Während des Wettbewerbs wurden …
Ich habe ein OLS-Regressionsmodell für einen Datensatz mit 5 unabhängigen Variablen ausgeführt. Die unabhängigen Variablen und die abhängige Variable sind beide stetig und stehen in linearer Beziehung zueinander. Der R-Platz ist ungefähr 99,3%. Aber wenn ich dasselbe mit einer zufälligen Gesamtstruktur in R ausführe, ist mein Ergebnis '% Var Explained: …
Ist es möglich, die Kosten einer Fehlklassifizierung im R-Paket randomForest zu kontrollieren ? In meiner eigenen Arbeit sind falsch negative Ergebnisse (z. B. das Fehlen einer Krankheit) weitaus kostspieliger als falsch positive Ergebnisse. Das Paket rpart ermöglicht es dem Benutzer, Fehlklassifizierungskosten zu kontrollieren, indem eine Verlustmatrix angegeben wird, um Fehlklassifizierungen …
Ich bin ein bisschen neu in Datamining / Maschinelles Lernen / etc. und haben über ein paar Möglichkeiten gelesen, mehrere Modelle und Läufe desselben Modells zu kombinieren, um Vorhersagen zu verbessern. Mein Eindruck beim Lesen einiger Artikel (die oft interessant und großartig in Bezug auf Theorie und griechische Buchstaben, aber …
Ich bin kein Experte für zufällige Gesamtstrukturen, aber ich verstehe klar, dass das Hauptproblem bei zufälligen Gesamtstrukturen die (zufällige) Baumgenerierung ist. Können Sie mir erklären, wie die Bäume entstehen? (dh was ist die verwendete Verteilung für die Baumerzeugung?) Danke im Voraus !
Ich würde gerne wissen, ob die Verwendung geschichteter Stichproben anstelle von Zufallsstichproben einige Vorteile hat, wenn der ursprüngliche Datensatz in Trainings- und Testsätze für die Klassifizierung aufgeteilt wird. Bringt geschichtete Stichprobe mehr Verzerrung in den Klassifikator als zufällige Stichprobe? Die Anwendung, für die ich eine geschichtete Stichprobe zur Datenaufbereitung verwenden …
Ich experimentiere mit Scikit-Learn in zufälligen Wäldern und erhalte großartige Ergebnisse mit meinem Trainingssatz, aber relativ schlechte Ergebnisse mit meinem Testsatz ... Hier ist das Problem (inspiriert vom Poker), das ich zu lösen versuche: Mit den Hole Cards von Spieler A, den Hole Cards von Spieler B und einem Flop …
Wenn ich in einem maschinellen Lernalgorithmus richtig verstanden habe, muss das Modell aus seiner Erfahrung lernen, dh wenn das Modell die falsche Vorhersage für die neuen Fälle liefert, muss es sich an die neuen Beobachtungen anpassen und mit der Zeit wird das Modell immer besser . Ich sehe nicht, dass …
Zufällige Wälder werden für die Regression verwendet. Soweit ich weiß, weisen sie jedoch jedem Blatt einen durchschnittlichen Zielwert zu. Da es in jedem Baum nur begrenzte Blätter gibt, gibt es nur bestimmte Werte, die das Ziel mit unserem Regressionsmodell erreichen kann. Ist es also nicht nur eine "diskrete" Regression (wie …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.