Data Science python

4

Python-Bibliothek für segmentierte Regression (auch stückweise Regression genannt)

Ich suche eine Python-Bibliothek, die segmentierte Regression (auch bekannt als stückweise Regression) durchführen kann . Beispiel :

16 python linear-regression library software-recommendation

3

Diskriminierende Ein-Klassen-Klassifizierung mit unausgewogenem, heterogenem negativem Hintergrund?

Ich arbeite daran, einen vorhandenen überwachten Klassifikator zu verbessern, um {Protein} -Sequenzen als zu einer bestimmten Klasse gehörig zu klassifizieren (Neuropeptidhormon-Vorläufer) oder nicht. Es gibt ungefähr 1.150 bekannte "Positive" vor einem Hintergrund von ungefähr 13 Millionen Proteinsequenzen ("Unbekannter / schlecht kommentierter Hintergrund") oder ungefähr 100.000 überprüfte, relevante Proteine, die mit …

16 machine-learning data-mining python classification

6

Was ist der Grund für die Protokolltransformation weniger kontinuierlicher Variablen?

Ich habe ein Klassifizierungsproblem gemacht und den Code und die Tutorials vieler Leute gelesen. Eine Sache, die mir aufgefallen ist, ist, dass viele Leute nehmen np.logoder logvon stetigen Variablen wie loan_amountoder applicant_incomeusw. Ich möchte nur den Grund dahinter verstehen. Hilft es, die Genauigkeit unserer Modellvorhersage zu verbessern? Ist es obligatorisch? …

16 machine-learning python classification scikit-learn

5

Vergrößere die seaborn Heatmap

Ich erstelle einen corr()DF aus einem Original-DF. Die corr()df herauskommen 70 X 70 , und es ist unmöglich , die Heatmap sichtbar zu machen ... sns.heatmap(df). Wenn ich versuche, das anzuzeigen corr = df.corr(), passt die Tabelle nicht auf den Bildschirm und ich kann alle Zusammenhänge sehen. Ist es eine …

16 visualization pandas plotting machine-learning neural-network svm decision-trees svm efficiency python linear-regression machine-learning nlp topic-model lda named-entity-recognition naive-bayes-classifier association-rules fuzzy-logic kaggle deep-learning tensorflow inception classification feature-selection feature-engineering machine-learning scikit-learn tensorflow keras encoding nlp text-mining nlp rnn python neural-network feature-extraction machine-learning predictive-modeling python r linear-regression clustering r ggplot2 neural-network neural-network training python neural-network deep-learning rnn predictive-modeling databases sql programming distribution dataset cross-validation neural-network deep-learning rnn machine-learning machine-learning python deep-learning data-mining tensorflow visualization tools sql embeddings orange feature-extraction unsupervised-learning gan machine-learning python data-mining pandas machine-learning data-mining bigdata apache-spark apache-hadoop deep-learning python convnet keras aggregation clustering k-means r random-forest decision-trees reference-request visualization data pandas plotting neural-network keras rnn theano deep-learning tensorflow inception predictive-modeling deep-learning regression sentiment-analysis nlp encoding deep-learning python scikit-learn lda convnet keras predictive-modeling regression overfitting regression svm prediction machine-learning similarity word2vec information-retrieval word-embeddings neural-network deep-learning rnn

3

Wie bekomme ich Vorhersagen mit predict_generator zum Streaming von Testdaten in Keras?

Im Keras-Blog zum Training von Convnets von Grund auf wird im Code nur das Netzwerk angezeigt , das mit Trainings- und Validierungsdaten ausgeführt wird. Was ist mit Testdaten? Entsprechen die Validierungsdaten den Testdaten (glaube ich nicht)? Wenn ein separater Testordner in ähnlichen Zeilen wie der Zug- und der Validierungsordner vorhanden …

16 machine-learning python deep-learning keras confusion-matrix

2

Keras Callback-Beispiel zum Speichern eines Modells nach jeder Epoche?

Kann jemand bitte ein einfaches Beispiel für Keras posten, indem er einen Rückruf verwendet, um ein Modell nach jeder Epoche zu speichern? Ich kann Beispiele für das Speichern von Gewichten finden, möchte aber nach jeder Trainingsepoche ein voll funktionsfähiges Modell speichern können.

16 python keras

8

Wie kann die Anzahl der fehlenden Werte in jeder Zeile im Pandas-Datenrahmen gezählt werden?

Wie kann ich die Anzahl der fehlenden Werte in jeder Zeile im Pandas-Datenrahmen ermitteln? Ich möchte den Datenrahmen in verschiedene Datenrahmen aufteilen, die in jeder Zeile die gleiche Anzahl fehlender Werte aufweisen. Irgendein Vorschlag?

16 python pandas

5

Python-Bibliothek zur Implementierung von Hidden-Markov-Modellen

Mit welcher stabilen Python-Bibliothek kann ich Hidden Markov Models implementieren? Ich muss einigermaßen gut dokumentiert sein, da ich dieses Modell noch nie wirklich benutzt habe. Alternativ gibt es einen direkteren Ansatz zur Durchführung einer Zeitreihenanalyse für einen Datensatz unter Verwendung von HMM?

15 python time-series markov-process

5

Satzähnlichkeitsvorhersage

Ich möchte das folgende Problem lösen: Ich habe eine Reihe von Sätzen als Datensatz, und ich möchte in der Lage sein, einen neuen Satz einzugeben und den Satz zu finden, der dem neuen Satz im Datensatz am ähnlichsten ist. Ein Beispiel würde so aussehen: Neuer Satz: " I opened a …

15 python nlp scikit-learn similarity text

4

Ist Pandas jetzt schneller als data.table?

https://github.com/Rdatatable/data.table/wiki/Benchmarks-%3A-Grouping Die data.table-Benchmarks wurden seit 2014 nicht mehr aktualisiert. Ich habe gehört, dass sie Pandasjetzt schneller sind als data.table. Ist das wahr? Hat jemand irgendwelche Benchmarks gemacht? Ich habe Python noch nie benutzt, würde aber überlegen zu wechseln, ob ich pandasschlagen kann data.table?

15 python r pandas data data.table

3

Auf der Suche nach einem guten Paket zur Erkennung von Anomalien in Zeitreihen

Gibt es ein umfassendes Open Source-Paket (vorzugsweise in Python oder R), das zur Erkennung von Anomalien in Zeitreihen verwendet werden kann? In scikit-learn gibt es ein SVM-Paket für eine Klasse, das jedoch nicht für Zeitreihendaten bestimmt ist. Ich suche nach komplexeren Paketen, die beispielsweise Bayes'sche Netzwerke zur Erkennung von Anomalien …

15 python time-series anomaly-detection

1

Ist eine geschichtete Stichprobe erforderlich (zufällige Gesamtstruktur, Python)?

Ich verwende Python, um ein zufälliges Gesamtstrukturmodell für mein unausgeglichenes Dataset auszuführen (die Zielvariable war eine Binärklasse). Bei der Aufteilung des Trainings- und Testdatensatzes hatte ich Probleme, geschichtete Stichproben (wie der gezeigte Code) zu verwenden oder nicht. Bisher stellte ich in meinem Projekt fest, dass der geschichtete Fall zu einer …

14 machine-learning python random-forest sampling training

2

Binäres Klassifizierungsmodell für unausgeglichene Daten

Ich habe einen Datensatz mit folgenden Spezifikationen: Trainingsdatensatz mit 193.176 Proben mit 2.821 Positiven Testdatensatz mit 82.887 Proben mit 673 Positiven Es gibt 10 Funktionen. Ich möchte eine binäre Klassifizierung (0 oder 1) durchführen. Das Problem, mit dem ich konfrontiert bin, ist, dass die Daten sehr unausgeglichen sind. Nach der …

14 machine-learning python classification logistic-regression

5

Machen moderne R- und / oder Python-Bibliotheken SQL überflüssig?

Ich arbeite in einem Büro, in dem SQL Server das Rückgrat von allem ist, was wir tun, von der Datenverarbeitung über die Reinigung bis hin zum Mungieren. Mein Kollege hat sich darauf spezialisiert, komplexe Funktionen und gespeicherte Prozeduren zu schreiben, um eingehende Daten methodisch so zu verarbeiten, dass sie standardisiert …

14 python r data-cleaning data sql

2

Wie funktioniert SelectKBest?

Ich schaue mir dieses Tutorial an: https://www.dataquest.io/mission/75/improving-your-submission In Abschnitt 8, in dem die besten Funktionen gefunden werden, wird der folgende Code angezeigt. import numpy as np from sklearn.feature_selection import SelectKBest, f_classif predictors = ["Pclass", "Sex", "Age", "SibSp", "Parch", "Fare", "Embarked", "FamilySize", "Title", "FamilyId"] # Perform feature selection selector = SelectKBest(f_classif, …

14 python scikit-learn

Als «python» getaggte Fragen