Data Science data-mining

4

Ich bin auf folgendes Problem gestoßen, das ich eher typisch finde. Ich habe einige große Datenmengen, beispielsweise einige Millionen Zeilen. Ich führe eine nicht triviale Analyse durch, z. B. eine SQL-Abfrage, die aus mehreren Unterabfragen besteht. Ich erhalte ein Ergebnis, das zum Beispiel besagt, dass die Eigenschaft X mit der …

10 data-mining sql experiments

1

Clustering von in ElasticSearch gespeicherten Kundendaten

Ich habe eine Reihe von Kundenprofilen in einem Elasticsearch- Cluster gespeichert . Diese Profile werden jetzt zum Erstellen von Zielgruppen für unsere E-Mail-Abonnements verwendet. Zielgruppen werden jetzt manuell mithilfe von Facetten-Suchfunktionen für Elasticsearch gebildet (z. B. alle männlichen Kunden im Alter von 23 Jahren mit einem Auto und 3 Kindern). …

10 data-mining clustering

3

Beziehung zwischen Faltung in Mathematik und CNN

Ich habe die Erklärung der Faltung gelesen und verstehe sie bis zu einem gewissen Grad. Kann mir jemand helfen zu verstehen, wie diese Operation mit der Faltung in Faltungs-Neuronalen Netzen zusammenhängt? Ist eine filterähnliche Funktion, gdie Gewicht anwendet?

10 machine-learning neural-network deep-learning cnn convolution machine-learning ensemble-modeling machine-learning classification data-mining clustering machine-learning feature-selection convnet pandas graphs ipython machine-learning apache-spark multiclass-classification naive-bayes-classifier multilabel-classification machine-learning data-mining dataset data-cleaning data machine-learning data-mining statistics correlation machine-learning data-mining dataset data-cleaning data beginner career python r visualization machine-learning data-mining nlp stanford-nlp dataset linear-regression time-series correlation anomaly-detection ensemble-modeling data-mining machine-learning python data-mining recommender-system machine-learning cross-validation model-selection scoring prediction sequential-pattern-mining categorical-data python tensorflow image-recognition statistics machine-learning data-mining predictive-modeling data-cleaning preprocessing classification deep-learning tensorflow machine-learning algorithms data keras categorical-data reference-request loss-function classification logistic-regression apache-spark prediction naive-bayes-classifier beginner nlp word2vec vector-space-models scikit-learn decision-trees data programming

3

Wie mache ich ein Batch-Innenprodukt in Tensorflow?

Ich habe zwei Tensoren a:[batch_size, dim] b:[batch_size, dim]. Ich möchte inneres Produkt für jedes Paar in der Charge machen c:[batch_size, 1], wo erzeugen c[i,0]=a[i,:].T*b[i,:]. Wie?

10 tensorflow scikit-learn svm cross-validation feature-selection bayesian machine-learning decision-trees parameter-estimation neural-network convnet neural-network regularization visualization machine-learning similarity python pandas indexing r data-cleaning machine-learning predictive-modeling data-cleaning recommender-system python sequential-pattern-mining software-recommendation r visualization gaussian distribution machine-learning data-mining bigdata apache-hadoop predictive-modeling logistic-regression sampling machine-learning regression feature-selection mongodb neural-network inception machine-learning classification dataset databases logistic-regression deep-learning backpropagation classification data-mining multilabel-classification text-mining data-cleaning unsupervised-learning anomaly-detection python r python pandas

2

Wann sollte man eine lineare Regression oder eine Entscheidungsbaum- oder eine zufällige Waldregression wählen? [geschlossen]

Geschlossen . Diese Frage muss fokussierter sein . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so, dass sie sich nur auf ein Problem konzentriert, indem Sie diesen Beitrag bearbeiten . Geschlossen vor 4 Jahren . Ich arbeite an einem Projekt und habe Schwierigkeiten …

10 machine-learning algorithms random-forest linear-regression decision-trees machine-learning predictive-modeling forecast r clustering similarity data-mining dataset statistics text-mining text-mining data-cleaning data-wrangling machine-learning classification algorithms xgboost data-mining dataset dataset regression graphs svm unbalanced-classes cross-validation optimization hyperparameter genetic-algorithms visualization predictive-modeling correlation machine-learning predictive-modeling apache-spark statistics normalization apache-spark map-reduce r correlation confusion-matrix r data-cleaning classification terminology dataset image-classification machine-learning regression apache-spark machine-learning data-mining nlp parsing machine-learning dimensionality-reduction visualization clustering multiclass-classification evaluation unsupervised-learning machine-learning machine-learning data-mining supervised-learning unsupervised-learning machine-learning data-mining classification statistics predictive-modeling data-mining clustering python pandas machine-learning dataset data-cleaning data bigdata software-recommendation

3

NASDAQ-Handelsdaten

Ich versuche, Bestandsdaten zu finden, mit denen ich üben kann. Gibt es dafür eine gute Ressource? Ich habe folgendes gefunden: ftp://emi.nasdaq.com/ITCH/ aber es hat nur das aktuelle Jahr. Ich habe bereits eine Möglichkeit, das Protokoll zu analysieren, möchte aber weitere Daten zum Vergleichen haben. Es muss nicht dasselbe Format haben, …

10 data-mining dataset

5

So erstellen Sie eine gute Liste von Stoppwörtern

Ich suche nach Hinweisen, wie man eine Liste von Stoppwörtern kuratiert. Kennt / kann jemand eine gute Methode empfehlen, um Stoppwortlisten zur Vorverarbeitung und Filterung aus dem Datensatz selbst zu extrahieren? Die Daten: Eine große Menge menschlicher Texteingaben mit variabler Länge (Suchbegriffe und ganze Sätze (bis zu 200 Zeichen)) über …

9 data-mining nlp information-retrieval language-model

2

Wie modelliere ich das Kaufverhalten eines Nutzers bei Amazon?

Für unser Abschlussprojekt in Data Science haben wir Folgendes vorgeschlagen: Geben Sie den Amazon Reviews-Datensatz an . Wir planen, einen Algorithmus zu entwickeln (der grob auf dem personalisierten PageRank basiert), der eine strategische Position für die Platzierung von Anzeigen bei Amazon festlegt. Zum Beispiel gibt es bei Amazon Millionen von …

9 machine-learning data-mining dataset recommender-system

1

Signalcodierung lernen

Ich habe eine große Anzahl von Samples, die Manchester-codierte Bitströme als Audiosignale darstellen. Die Frequenz, mit der sie codiert werden, ist die primäre Frequenzkomponente, wenn sie hoch ist, und im Hintergrund ist eine konstante Menge an weißem Rauschen zu sehen. Ich habe diese Streams manuell dekodiert, aber ich habe mich …

9 machine-learning data-mining scalability algorithms feature-selection

1

Relationales Data Mining ohne ILP

Ich habe einen riesigen Datensatz aus einer relationalen Datenbank, für den ich ein Klassifizierungsmodell erstellen muss. Normalerweise würde ich für diese Situation die induktive Logikprogrammierung (ILP) verwenden, aber aufgrund besonderer Umstände kann ich das nicht tun. Die andere Möglichkeit, dies in Angriff zu nehmen, besteht darin, zu versuchen, die Werte …

9 data-mining classification relational-dbms

2

Erkennung menschlicher Aktivitäten unter Verwendung eines Smartphone-Datensatzproblems

Ich bin neu in dieser Community und hoffe, dass meine Frage hier gut passt. Im Rahmen meines Bachelor-Studiengangs Datenanalyse habe ich mich für das Projekt zur Erkennung menschlicher Aktivitäten mithilfe von Smartphone-Datensätzen entschieden. Für mich bezieht sich dieses Thema auf maschinelles Lernen und die Unterstützung von Vektormaschinen. Ich bin mit …

9 bigdata machine-learning databases clustering data-mining

6

Python: Umgang mit Ungleichgewichtsklassen in Python Machine Learning

Ich habe einen Datensatz, für den ich versuche, Zielvariablen vorherzusagen. Col1 Col2 Col3 Col4 Col5 1 2 23 11 1 2 22 12 14 1 22 11 43 38 3 14 22 25 19 3 12 42 11 14 1 22 11 43 38 2 1 2 23 11 4 …

9 machine-learning python data-mining dataset pandas

5

Clustering mit Kosinusähnlichkeit

Ich habe einen großen Datensatz und eine Kosinusähnlichkeit zwischen ihnen. Ich möchte sie mit Cosinus-Ähnlichkeit gruppieren, die ähnliche Objekte zusammenfügt, ohne vorher die Anzahl der erwarteten Cluster angeben zu müssen. Ich habe die sklearn-Dokumentation von DBSCAN und Affinity Propagation gelesen, in der beide eine Distanzmatrix (keine Kosinus-Ähnlichkeitsmatrix) benötigen. Wirklich, ich …

8 machine-learning data-mining clustering text-mining

2

Verwendung von NLP zur Automatisierung der Kategorisierung der Benutzerbeschreibung

Ich habe eine große Anzahl von Kundenbeschwerden über die Produkte, die mein Unternehmen besitzt, und ich möchte eine Datenanalyse dieser Beschreibungen durchführen und jedem von ihnen eine Kategorie zuordnen. Beispiel: Ich muss die Anzahl der Beschwerden auf der Software- und Hardwareseite meines Produkts anhand der Kundenbeschwerden ermitteln. Derzeit verwende ich …

8 data-mining classification nlp categorical-data

3

Was nützt die Erfassung von Benutzerdaten neben der Schaltung von Anzeigen?

Nun, dies scheint der am besten geeignete Ort für diese Frage zu sein. Jede Website sammelt Daten des Benutzers, einige nur zur Benutzerfreundlichkeit und Personalisierung, aber die meisten wie soziale Netzwerke verfolgen jede Bewegung im Web, einige kostenlose Apps auf Ihrem Telefon scannen Textnachrichten, den Anrufverlauf und so weiter. All …

8 data-mining

Als «data-mining» getaggte Fragen