Data Science

Fragen und Antworten für Data Science-Experten, Machine Learning-Spezialisten und alle, die mehr über das Feld erfahren möchten


1
Gradient Boosting Tree: „Je variabler desto besser“?
Aus dem Tutorial des XGBoost geht hervor, dass, wenn jeder Baum wächst, alle Variablen gescannt werden, um ausgewählt zu werden, um Knoten zu teilen, und die mit der maximalen Verstärkungsaufteilung ausgewählt wird. Meine Frage ist also, was wäre, wenn ich dem Datensatz einige Rauschvariablen hinzufügen würde, würden diese Rauschvariablen die …

3
Wie verwende ich GAN für die unbeaufsichtigte Merkmalsextraktion aus Bildern?
Ich habe verstanden, wie GAN funktioniert, während zwei Netzwerke (generativ und diskriminativ) miteinander konkurrieren. Ich habe ein DCGAN (GAN mit Faltungsdiskriminator und Entfaltungsgenerator) erstellt, das jetzt erfolgreich handschriftliche Ziffern generiert, die denen im MNIST-Datensatz ähneln. Ich habe viel über GANs Anwendungen zum Extrahieren von Funktionen aus Bildern gelesen. Wie kann …

1
Vermeiden Sie das erneute Laden von DataFrame zwischen verschiedenen Python-Kerneln
Gibt es eine Möglichkeit, eine Variable (große Tabelle / Datenrahmen) im Speicher zu behalten und für mehrere Ipython-Notizbücher freizugeben? Ich würde nach etwas suchen, das konzeptionell den persistenten Variablen von MATLAB ähnlich ist. Dort ist es möglich, eine benutzerdefinierte Funktion / Bibliothek von mehreren einzelnen Editoren (Notizbüchern) aufzurufen und diese …


3
Wie exportiere ich eine Zelle eines Jupyter-Notebooks?
Ich arbeite gerade an einem Jupyter- Notebook. Ich möchte einen Teil meines Codes auf einer eigenständigen iPython- Shell ausführen . Im Moment exportiere ich meinen iPython- Code (Datei -> Download als) und führe ihn dann in meinem iPython aus (mit% run). Es funktioniert, aber ich möchte nur eine Zelle oder …
10 ipython  jupyter 




1
SO WIRD'S GEMACHT: Deep Initialisierung des neuronalen Netzwerks
Angesichts schwieriger Lernaufgaben (z. B. hohe Dimensionalität, inhärente Datenkomplexität) sind tiefe neuronale Netze schwer zu trainieren. Um viele der Probleme zu lösen, könnte man: Normalisieren Sie && Handpick- Qualitätsdaten Wählen Sie einen anderen Trainingsalgorithmus (z. B. RMSprop anstelle von Gradient Descent). Wählen Sie einen steileren Gradienten Kostenfunktion (z. B. Cross …


1
XGBoost Linear Regression Ausgabe falsch
Ich bin ein Neuling bei XGBoost, also verzeihen Sie meine Unwissenheit. Hier ist der Python-Code: import pandas as pd import xgboost as xgb df = pd.DataFrame({'x':[1,2,3], 'y':[10,20,30]}) X_train = df.drop('y',axis=1) Y_train = df['y'] T_train_xgb = xgb.DMatrix(X_train, Y_train) params = {"objective": "reg:linear"} gbm = xgb.train(dtrain=T_train_xgb,params=params) Y_pred = gbm.predict(xgb.DMatrix(pd.DataFrame({'x':[4,5]}))) print Y_pred Ausgabe …

2
Was tun, wenn das Testen von Daten weniger Funktionen als die Trainingsdaten hat?
Angenommen, wir prognostizieren den Verkauf eines Geschäfts und meine Trainingsdaten weisen zwei Funktionen auf: Eine über den Ladenverkauf mit den Daten (das Feld "Laden" ist nicht eindeutig) Eine über die Geschäftstypen (das Feld "Geschäft" ist hier eindeutig) Die Matrix würde also ungefähr so ​​aussehen: +-------+-----------+------------+---------+-----------+------+-------+--------------+ | Store | DayOfWeek | …

2
Wie kommen Wissenschaftler auf die richtigen Parameter und Topologien des Hidden Markov-Modells?
Ich verstehe, wie ein Hidden-Markov-Modell in genomischen Sequenzen verwendet wird, beispielsweise beim Auffinden eines Gens. Aber ich verstehe nicht, wie ich ein bestimmtes Markov-Modell entwickeln soll. Ich meine, wie viele Staaten sollte das Modell haben? Wie viele mögliche Übergänge? Sollte das Modell eine Schleife haben? Wie würden sie wissen, dass …

1
Benutzerprodukt positiv (Klickdaten) verfügbar. Wie generiere ich negative (No-Click-Daten)?
Es ist sehr häufig, dass wir Benutzerproduktdaten haben, die als "Klick" gekennzeichnet sind. Um das Modell zu lernen, benötige ich Klick- und No-Click-Daten. Der einfachste Ansatz zum Generieren besteht darin, Benutzer-Produkt-Paare zu verwenden, die nicht in Klickdaten enthalten sind. Dies kann jedoch irreführend sein. Beispiel: user1, product1 (click) user2, product2 …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.