Als «scikit-learn» getaggte Fragen

scikit-learn ist eine Bibliothek für maschinelles Lernen für Python, die einfache und effiziente Tools für die Datenanalyse und das Data Mining bietet, wobei der Schwerpunkt auf maschinellem Lernen liegt. Es ist für jedermann zugänglich und in verschiedenen Kontexten wiederverwendbar. Es basiert auf NumPy und SciPy. Das Projekt ist Open Source und kommerziell nutzbar (BSD-Lizenz).

20
Beschriftungscodierung über mehrere Spalten in scikit-learn
Ich versuche, Scikit-Learns zu verwenden LabelEncoder, um Pandas DataFramevon String-Labels zu codieren . Da der Datenrahmen viele (50+) Spalten enthält, möchte ich vermeiden, LabelEncoderfür jede Spalte ein Objekt zu erstellen . Ich hätte lieber nur ein großes LabelEncoderObjekt, das in allen meinen Datenspalten funktioniert . Wenn Sie das Ganze DataFramein …


6
Speichern Sie den Klassifikator in scikit-learn auf der Festplatte
Wie speichere ich einen trainierten Naive Bayes-Klassifikator auf der Festplatte und verwende ihn zur Vorhersage von Daten? Ich habe das folgende Beispielprogramm von der scikit-learn-Website: from sklearn import datasets iris = datasets.load_iris() from sklearn.naive_bayes import GaussianNB gnb = GaussianNB() y_pred = gnb.fit(iris.data, iris.target).predict(iris.data) print "Number of mislabeled points : %d" …

15
ImportError: Kein Modul mit dem Namen sklearn.cross_validation
Ich verwende Python 2.7 in Ubuntu 14.04. Ich habe scikit-learn, numpy und matplotlib mit folgenden Befehlen installiert: sudo apt-get install build-essential python-dev python-numpy \ python-numpy-dev python-scipy libatlas-dev g++ python-matplotlib \ ipython Aber wenn ich diese Pakete importiere: from sklearn.cross_validation import train_test_split Es gibt mir diesen Fehler zurück: ImportError: No module …





10
RuntimeWarning: Die Größe von numpy.dtype wurde geändert und weist möglicherweise auf eine binäre Inkompatibilität hin
Ich habe diesen Fehler beim Versuch, ein gespeichertes SVM-Modell zu laden. Ich habe versucht, sklearn, NumPy und SciPy zu deinstallieren und die neuesten Versionen erneut zusammen zu installieren (mithilfe von pip). Ich erhalte immer noch diesen Fehler. Warum? In [1]: import sklearn; print sklearn.__version__ 0.18.1 In [3]: import numpy; print …



6
Pandas Dataframe-Spalten, die mit sklearn skaliert werden
Ich habe einen Pandas-Datenrahmen mit gemischten Spalten und möchte den min_max_scaler von sklearn auf einige der Spalten anwenden. Im Idealfall würde ich diese Transformationen gerne an Ort und Stelle durchführen, habe aber noch keinen Weg gefunden, dies zu tun. Ich habe den folgenden Code geschrieben, der funktioniert: import pandas as …


13
sklearn error ValueError: Die Eingabe enthält NaN, unendlich oder einen Wert, der für dtype zu groß ist ('float64').
Ich benutze sklearn und habe ein Problem mit der Affinitätsausbreitung. Ich habe eine Eingabematrix erstellt und erhalte immer wieder den folgenden Fehler. ValueError: Input contains NaN, infinity or a value too large for dtype('float64'). ich bin gerannt np.isnan(mat.any()) #and gets False np.isfinite(mat.all()) #and gets True Ich habe es versucht mat[np.isfinite(mat) …

6
Wie werden feature_importances in RandomForestClassifier ermittelt?
Ich habe eine Klassifizierungsaufgabe mit einer Zeitreihe als Dateneingabe, wobei jedes Attribut (n = 23) einen bestimmten Zeitpunkt darstellt. Neben dem absoluten Klassifizierungsergebnis möchte ich herausfinden, welche Attribute / Daten in welchem ​​Umfang zum Ergebnis beitragen. Deshalb benutze ich nur das feature_importances_, was für mich gut funktioniert. Ich würde jedoch …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.