Data Science python

1

Zuggenauigkeit vs Testgenauigkeit vs Verwirrungsmatrix

Nachdem ich mein Vorhersagemodell mit Random Forest entwickelt habe, erhalte ich die folgenden Metriken: Train Accuracy :: 0.9764634601043997 Test Accuracy :: 0.7933284397683713 Confusion matrix [[28292 1474] [ 6128 889]] Dies ist das Ergebnis dieses Codes: training_features, test_features, training_target, test_target, = train_test_split(df.drop(['bad_loans'], axis=1), df['target'], test_size = .3, random_state=12) clf = RandomForestClassifier() …

11 python predictive-modeling accuracy confusion-matrix classifier

1

So zeichnen Sie zwei Spalten eines einzelnen DataFrame auf der Y-Achse

Ich habe zwei DataFrames (Action, Comedy). Aktion enthält zwei Spalten (Jahr, Bewertung) Bewertungsspalten enthalten durchschnittliche Bewertung in Bezug auf das Jahr. Comedy Dataframe enthält dieselben zwei Spalten mit unterschiedlichen Mittelwerten. Ich füge beide Datenrahmen in einem total_year Datenrahmen zusammen Ausgabe von total_year Jetzt möchte ich total_year in einem Liniendiagramm darstellen, …

11 python pandas graphs dataframe

3

Beste Sprachen für wissenschaftliches Rechnen [geschlossen]

Geschlossen . Diese Frage muss fokussierter sein . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so, dass sie sich nur auf ein Problem konzentriert, indem Sie diesen Beitrag bearbeiten . Geschlossen vor 5 Jahren . Es scheint, als ob in den meisten Sprachen …

10 efficiency statistics tools knowledge-base machine-learning neural-network deep-learning optimization hyperparameter machine-learning time-series categorical-data logistic-regression python visualization bigdata efficiency classification binary svm random-forest logistic-regression data-mining sql experiments bigdata efficiency performance scalability distributed bigdata nlp statistics education knowledge-base definitions machine-learning recommender-system evaluation efficiency algorithms parameter efficiency scalability sql statistics visualization knowledge-base education machine-learning r python r text-mining sentiment-analysis machine-learning machine-learning python neural-network statistics reference-request machine-learning data-mining python classification data-mining bigdata usecase apache-hadoop map-reduce aws education feature-selection machine-learning machine-learning sports data-formats hierarchical-data-format bigdata apache-hadoop bigdata apache-hadoop python visualization knowledge-base classification confusion-matrix accuracy bigdata apache-hadoop bigdata efficiency apache-hadoop distributed machine-translation nlp metadata data-cleaning text-mining python pandas machine-learning python pandas scikit-learn bigdata machine-learning databases clustering data-mining recommender-system

1

Keras LSTM mit 1D-Zeitreihen

Ich lerne, wie man Keras verwendet, und ich habe mit meinem beschrifteten Datensatz anhand der Beispiele in Chollets Deep Learning für Python vernünftigen Erfolg gehabt . Der Datensatz ist ~ 1000 Zeitreihen mit einer Länge von 3125 mit 3 möglichen Klassen. Ich möchte über die grundlegenden dichten Schichten hinausgehen, die …

10 python deep-learning time-series lstm rnn

2

Versuch, TensorFlow zu verwenden, um finanzielle Zeitreihendaten vorherzusagen

Ich bin neu in ML und TensorFlow (ich habe vor ungefähr ein paar Stunden angefangen) und ich versuche, damit die nächsten Datenpunkte in einer Zeitreihe vorherzusagen. Ich nehme meinen Input und mache das damit: /----------- x ------------\ .-------------------------------. | 0 | 1 | 2 | 3 | 4 | 5 …

10 machine-learning python time-series tensorflow rnn

2

Warum dauert das Training auf meiner GPU so lange?

Einzelheiten: GPU : GTX 1080 Training : ~ 1,1 Millionen Bilder aus 10 Klassen Validierung : ~ 150 Tausend Bilder aus 10 Klassen Zeit pro Epoche : ~ 10 Stunden Ich habe CUDA, cuDNN und Tensorflow eingerichtet (auch Tensorflow-GPU). Ich denke nicht, dass mein Modell so kompliziert ist, dass es …

10 machine-learning python keras

3

Ein künstliches Neuronennetzwerk (ANN) mit einer beliebigen Anzahl von Ein- und Ausgängen

Ich möchte ANNs für mein Problem verwenden, aber das Problem ist, dass meine Ein- und Ausgabeknotennummern nicht behoben sind. Ich habe eine Google-Suche durchgeführt, bevor ich meine Frage gestellt habe, und festgestellt, dass der RNN mir bei meinem Problem helfen kann. Aber alle Beispiele, die ich gefunden habe, haben irgendwie …

10 python neural-network keras rnn pytorch

4

Visualisierung von häufig zusammen gekauften Artikeln

Ich habe einen Datensatz in folgender Struktur in eine CSV-Datei eingefügt: Banana Water Rice Rice Water Bread Banana Juice Jede Zeile zeigt eine Sammlung von Artikeln an, die zusammen gekauft wurden. Zum Beispiel zeigt die erste Zeile , dass die Elemente Banana, Water, und Ricezusammen gekauft wurden. Ich möchte eine …

10 python r data-mining visualization association-rules

1

Umformung von Daten für Deep Learning mit Keras

Ich bin ein Anfänger von Keras und habe mit dem MNIST-Beispiel begonnen, um zu verstehen, wie die Bibliothek tatsächlich funktioniert. Das Codefragment des MNIST-Problems im Keras-Beispielordner lautet wie folgt: import numpy as np np.random.seed(1337) # for reproducibility from keras.datasets import mnist from keras.models import Sequential from keras.layers import Dense, Dropout, …

10 python neural-network deep-learning keras

2

Python Machine Learning / Data Science Projektstruktur

Ich suche nach Informationen darüber, wie ein Python Machine Learning-Projekt organisiert werden soll. Für Python übliche Projekte gibt es Cookiecutter und für R ProjectTemplate . Dies ist meine aktuelle Ordnerstruktur, aber ich mische Jupyter Notebooks mit tatsächlichem Python-Code und es scheint nicht sehr klar zu sein. . ├── cache ├── …

10 python

2

Erstellen neuer Spalten durch Iterieren über Zeilen im Pandas-Datenrahmen

Ich habe einen Pandas-Datenrahmen (X11) wie folgt: Tatsächlich habe ich 99 Spalten bis zu dx99 dx1 dx2 dx3 dx4 0 25041 40391 5856 0 1 25041 40391 25081 5856 2 25041 40391 42822 0 3 25061 40391 0 0 4 25041 40391 0 5856 5 40391 25002 5856 3569 Ich …

10 python data-cleaning pandas anaconda

4

Wie kratzt man imdb Webseite?

Ich versuche, Web Scraping mit Python selbst zu lernen, um die Datenanalyse zu erlernen. Ich versuche, die imdb-Webseite zu durchsuchen, deren URL wie folgt lautet: http://www.imdb.com/search/title?sort=num_votes,desc&start=1&title_type=feature&year=1950,2012 Ich benutze das BeautifulSoup-Modul. Es folgt der Code, den ich verwende: r = requests.get(url) # where url is the above url bs = BeautifulSoup(r.text) …

10 data-mining python scraping

2

Wie kann ich kategoriale Datentypen für die zufällige Waldklassifizierung anpassen?

Ich muss die Genauigkeit eines Trainingsdatensatzes durch Anwendung des Random Forest-Algorithmus ermitteln. Aber der Typ meines Datensatzes ist sowohl kategorisch als auch numerisch. Beim Versuch, diese Daten anzupassen, wird eine Fehlermeldung angezeigt. 'Eingabe enthält NaN, unendlich oder einen Wert, der für dtype zu groß ist (' float32 ')'. Möglicherweise liegt …

10 python data-mining random-forest

2

Wie führe ich eine logistische Regression mit einer großen Anzahl von Funktionen durch?

Ich habe einen Datensatz mit 330 Stichproben und 27 Merkmalen für jede Stichprobe mit einem Binärklassenproblem für die logistische Regression. Gemäß der "Regel wenn zehn" benötige ich mindestens 10 Ereignisse für jedes Feature, um eingeschlossen zu werden. Ich habe jedoch einen unausgeglichenen Datensatz mit 20% positiver Klasse und 80% negativer …

10 machine-learning python predictive-modeling logistic-regression data

3

Suchen Sie die aufeinanderfolgenden Nullen in einem DataFrame und führen Sie eine bedingte Ersetzung durch

Ich habe einen Datensatz wie diesen: Beispieldatenrahmen import pandas as pd df = pd.DataFrame({ 'names': ['A','B','C','D','E','F','G','H','I','J','K','L'], 'col1': [0, 1, 0, 1, 1, 1, 0, 0, 0, 1, 0, 0], 'col2': [0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0]}) Ich möchte einige der 0's in col1und col2durch …

10 python pandas dataframe

Als «python» getaggte Fragen