Als «scikit-learn» getaggte Fragen

scikit-learn ist eine Bibliothek für maschinelles Lernen für Python, die einfache und effiziente Tools für die Datenanalyse und das Data Mining bietet, wobei der Schwerpunkt auf maschinellem Lernen liegt. Es ist für jedermann zugänglich und in verschiedenen Kontexten wiederverwendbar. Es basiert auf NumPy und SciPy. Das Projekt ist Open Source und kommerziell nutzbar (BSD-Lizenz).

13
ImportError beim Importieren aus sklearn: Name check_build kann nicht importiert werden
Beim Importieren aus sklearn wird folgende Fehlermeldung angezeigt: >>> from sklearn import svm Traceback (most recent call last): File "<pyshell#17>", line 1, in <module> from sklearn import svm File "C:\Python27\lib\site-packages\sklearn\__init__.py", line 16, in <module> from . import check_build ImportError: cannot import name check_build Ich benutze Python 2.7, Scipy-0.12.0b1 Superpack, Numpy-1.6.0 …

8
Ein Spaltenvektor y wurde übergeben, wenn ein 1d-Array erwartet wurde
Ich muss passen RandomForestRegressorvon sklearn.ensemble. forest = ensemble.RandomForestRegressor(**RF_tuned_parameters) model = forest.fit(train_fold, train_y) yhat = model.predict(test_fold) Dieser Code hat immer funktioniert, bis ich Daten vorverarbeitet habe ( train_y). Die Fehlermeldung lautet: DataConversionWarning: Ein Spaltenvektor y wurde übergeben, als ein 1d-Array erwartet wurde. Bitte ändern Sie die Form von y in (n_samples,), …

3
Python - Was genau ist sklearn.pipeline.Pipeline?
Ich kann nicht herausfinden, wie das sklearn.pipeline.Pipelinegenau funktioniert. Das Dokument enthält einige Erklärungen . Was meinen sie zum Beispiel mit: Pipeline von Transformationen mit einem endgültigen Schätzer. Was sind meine Fragen, um meine Frage klarer zu machen steps? Wie arbeiten Sie? Bearbeiten Dank der Antworten kann ich meine Frage klarer …

2
Wie funktioniert der Parameter class_weight in scikit-learn?
Ich habe große Probleme zu verstehen, wie der class_weightParameter in der logistischen Regression von scikit-learn funktioniert. Die Situation Ich möchte die logistische Regression verwenden, um eine binäre Klassifizierung für einen sehr unausgeglichenen Datensatz durchzuführen. Die Klassen sind mit 0 (negativ) und 1 (positiv) gekennzeichnet, und die beobachteten Daten liegen in …



4
Wie berechnet man mit scikit learn Präzision, Rückruf, Genauigkeit und f1-Score für den Fall mit mehreren Klassen?
Ich arbeite an einem Stimmungsanalyseproblem. Die Daten sehen folgendermaßen aus: label instances 5 1190 4 838 3 239 1 204 2 127 Meine Daten sind also unausgeglichen, da 1190 instancesmit gekennzeichnet sind 5. Für die Klassifizierung verwende ich den SVC von scikit . Das Problem ist, dass ich nicht weiß, …



10
sklearn: Beim Aufrufen von LinearRegression.fit () wurden Arrays mit inkonsistenter Anzahl von Samples gefunden.
Ich versuche nur, eine einfache lineare Regression durchzuführen, aber ich bin verblüfft über diesen Fehler für: regr = LinearRegression() regr.fit(df2.iloc[1:1000, 5].values, df2.iloc[1:1000, 2].values) welches produziert: ValueError: Found arrays with inconsistent numbers of samples: [ 1 999] Diese Auswahlen müssen die gleichen Abmessungen haben und sollten numpy Arrays sein. Was fehlt …
102 scikit-learn 


3
RandomForestClassifier vs ExtraTreesClassifier in scikit lernen
Kann jemand den Unterschied zwischen dem RandomForestClassifier und dem ExtraTreesClassifier in scikit lernen erklären. Ich habe viel Zeit damit verbracht, die Zeitung zu lesen: P. Geurts, D. Ernst. Und L. Wehenkel, "Extrem randomisierte Bäume", Machine Learning, 63 (1), 3-42, 2006 Es scheint, dass dies der Unterschied für ET ist: 1) …


7
Geschichteter Zug / Test-Split in Scikit-Learn
Ich muss meine Daten in einen Trainingssatz (75%) und einen Testsatz (25%) aufteilen. Ich mache das derzeit mit dem folgenden Code: X, Xt, userInfo, userInfo_train = sklearn.cross_validation.train_test_split(X, userInfo) Ich möchte jedoch meinen Trainingsdatensatz schichten. Wie mache ich das? Ich habe mich mit der StratifiedKFoldMethode befasst, aber ich kann die 75% …

5
Parameter "stratify" aus der Methode "train_test_split" (scikit Learn)
Ich versuche, train_test_splitvon Paket scikit Learn zu verwenden, aber ich habe Probleme mit Parametern stratify. Im Folgenden ist der Code: from sklearn import cross_validation, datasets X = iris.data[:,:2] y = iris.target cross_validation.train_test_split(X,y,stratify=y) Ich bekomme jedoch immer wieder das folgende Problem: raise TypeError("Invalid parameters passed: %s" % str(options)) TypeError: Invalid parameters …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.