Als «python» getaggte Fragen

Verwendung für datenwissenschaftliche Fragen zur Programmiersprache Python. Nicht für allgemeine Codierungsfragen vorgesehen (-> Stackoverflow).

3
Exportieren Sie Gewichte (Formel) aus Random Forest Regressor in Scikit-Learn
Ich habe ein Vorhersagemodell mit Scikit Learn in Python (Random Forest Regressor) trainiert und möchte die Gewichte der einzelnen Features irgendwie extrahieren, um ein Excel-Tool für die manuelle Vorhersage zu erstellen. Das einzige, was ich gefunden habe, ist das, model.feature_importances_aber es hilft nicht. Gibt es eine Möglichkeit, dies zu erreichen? …


2
Multivariate lineare Regression in Python
Ich suche nach einem Python-Paket, das eine multivariate lineare Regression implementiert. (Terminologische Anmerkung: Multivariate Regression befasst sich mit dem Fall, dass es mehr als eine abhängige Variable gibt, während multiple Regression den Fall behandelt, in dem es eine abhängige Variable, aber mehr als eine unabhängige Variable gibt.)



2
Clustering von Dokumenten unter Verwendung der aus Latent Dirichlet Allocation abgeleiteten Themen
Ich möchte Latent Dirichlet Allocation für ein Projekt verwenden und verwende Python mit der Gensim-Bibliothek. Nachdem ich die Themen gefunden habe, möchte ich die Dokumente mit einem Algorithmus wie k-means gruppieren (idealerweise möchte ich einen guten für überlappende Cluster verwenden, damit jede Empfehlung begrüßt wird). Ich habe es geschafft, die …

1
Unterschied zwischen interpolate () und fillna () bei Pandas
Da die Interpolations- und die Fillna-Methode die gleiche Arbeit zum Füllen von Na-Werten ausführen. Was ist der grundlegende Unterschied zwischen den beiden. Welche Bedeutung haben diese beiden unterschiedlichen Methoden? Kann mir jemand Laien erklären. Ich habe bereits die offizielle Dokumentation durchgesehen und wollte den Unterschied wissen

3
Verbessern Sie die Filtergeschwindigkeit des Pandas-Datenrahmens
Ich habe einen Datensatz mit 19 Spalten und ungefähr 250.000 Zeilen. Ich habe mit größeren Datensätzen gearbeitet, aber dieses Mal entschied sich Pandas, mit meinen Nerven zu spielen. Ich habe versucht, den ursprünglichen Datensatz anhand einiger einfacher Regeln in drei Unterdatenrahmen aufzuteilen. Die Ausführung des Codes dauert jedoch lange. Etwa …

2
So trainieren Sie das Modell, um Ereignisse 30 Minuten zuvor anhand mehrdimensionaler Zeitreihen vorherzusagen
Experten auf meinem Gebiet sind in der Lage , die Wahrscheinlichkeit eines Ereignisses (binäre Spitze in Gelb) 30 Minuten vor seinem Auftreten vorherzusagen . Die Frequenz beträgt hier 1 Sek., Diese Ansicht repräsentiert Daten im Wert von einigen Stunden. Ich habe schwarz eingekreist, wo "böswilliges" Muster sein sollte . Wechselwirkungen …


1
Python Seaborn: Wie werden Fehlerbalken in Barplots berechnet?
Ich verwende die Seaborn-Bibliothek, um Balkendiagramme in Python zu erstellen. Ich frage mich, welche Statistiken zur Berechnung der Fehlerbalken verwendet werden, kann aber in der Barplot-Dokumentation des Seaborn keinen Hinweis darauf finden . Ich weiß, dass die Balkenwerte in meinem Fall basierend auf dem Mittelwert berechnet werden (die Standardoption), und …

2
Unzulässige Größe der zufälligen Gesamtstruktur beim Speichern auf der Festplatte
Beim Speichern auf der Festplatte mit cPickle: /programming/20662023/save-python-random-forest-model-to-file beträgt meine zufällige Gesamtstruktur 6,57 GB. with open('rforest.cpickle', 'wb') as f: cPickle.dump(rforest, f) Ich möchte die Gesamtstruktur selbst verwenden, um Vorhersagen über eine auf Heroku gehostete Python-API zu treffen - natürlich ist diese Dateigröße nicht akzeptabel. Warum ist die Datei so groß? …



2
Wie verwende ich Cohens Kappa als Bewertungsmetrik in GridSearchCV in Scikit Learn?
Ich habe ein Klassenungleichgewicht im Verhältnis 1:15, dh eine sehr niedrige Ereignisrate. Um die Abstimmungsparameter von GBM in Scikit Learn auszuwählen, möchte ich Kappa anstelle der F1-Punktzahl verwenden. Mein Verständnis ist, dass Kappa eine bessere Metrik als die F1-Punktzahl für das Klassenungleichgewicht ist. Aber ich konnte Kappa als Evaluierungsmetrik in …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.