Data Science randomized-algorithms

1

Warum ist xgboost so viel schneller als sklearn GradientBoostingClassifier?

Ich versuche, ein Steigungsverstärkungsmodell mit über 50.000 Beispielen und 100 numerischen Merkmalen zu trainieren. XGBClassifierBewältigt 500 Bäume innerhalb von 43 Sekunden auf meiner Maschine, während GradientBoostingClassifiernur 10 Bäume (!) in 1 Minute und 2 Sekunden bearbeitet werden :( Ich habe nicht versucht, 500 Bäume zu züchten, da dies Stunden dauern …

29 scikit-learn xgboost gbm data-mining classification data-cleaning machine-learning reinforcement-learning data-mining bigdata dataset nlp language-model stanford-nlp machine-learning neural-network deep-learning randomized-algorithms machine-learning beginner career xgboost loss-function neural-network software-recommendation naive-bayes-classifier classification scikit-learn feature-selection r random-forest cross-validation data-mining python scikit-learn random-forest churn python clustering k-means machine-learning nlp sentiment-analysis machine-learning programming python scikit-learn nltk gensim visualization data csv neural-network deep-learning descriptive-statistics machine-learning supervised-learning text-mining orange data parameter-estimation python pandas scraping r clustering k-means unsupervised-learning

2

Warum sollte die Initialisierung von Gewichten und Bias bei 0 gewählt werden?

Ich lese das: Um unser neuronales Netzwerk zu trainieren, werden wir jeden Parameter W (l) ijWij (l) und jeden b (l) ibi (l) auf einen kleinen Zufallswert nahe Null initialisieren (sagen wir gemäß einem Normalen (0, ϵ2) Normalen (0)) , ϵ2) Verteilung für einige kleine ϵϵ, sagen wir 0,01) von …

12 deep-learning stanford-nlp randomized-algorithms

1

SO WIRD'S GEMACHT: Deep Initialisierung des neuronalen Netzwerks

Angesichts schwieriger Lernaufgaben (z. B. hohe Dimensionalität, inhärente Datenkomplexität) sind tiefe neuronale Netze schwer zu trainieren. Um viele der Probleme zu lösen, könnte man: Normalisieren Sie && Handpick- Qualitätsdaten Wählen Sie einen anderen Trainingsalgorithmus (z. B. RMSprop anstelle von Gradient Descent). Wählen Sie einen steileren Gradienten Kostenfunktion (z. B. Cross …

10 machine-learning neural-network deep-learning randomized-algorithms

2

Was ist die effizienteste Methode zur Optimierung von Hyperparametern beim Scikit-Lernen?

Eine Übersicht über den Hyperparameter-Optimierungsprozess in scikit-learn finden Sie hier . Eine umfassende Rastersuche findet den optimalen Satz von Hyperparametern für ein Modell. Der Nachteil ist, dass die umfassende Rastersuche langsam ist. Die zufällige Suche ist schneller als die Rastersuche, weist jedoch eine unnötig hohe Varianz auf. Es gibt auch …

10 scikit-learn hyperparameter hyperparameter-tuning grid-search randomized-algorithms

Als «randomized-algorithms» getaggte Fragen