Data Science

Fragen und Antworten für Data Science-Experten, Machine Learning-Spezialisten und alle, die mehr über das Feld erfahren möchten

1
Theano in der Deep-Learning-Forschung
Wie weit verbreitet ist Theano in der Deep-Learning-Forschung? Ist Theano ein guter Anfang, um die Implementierung von Algorithmen für maschinelles Lernen zu lernen? Wird es wirklich helfen, die Implementierung eines Feed-Forward-Netzwerks zu lernen? Implementieren Doktoranden während ihrer College-Tage mindestens einmal neuronale Netze oder andere Algorithmen? Hintergrund: Ich habe eine vernünftige …

4
Wie lerne ich die Erkennung von Spam-E-Mails?
Ich möchte erfahren, wie ein Spam-E-Mail-Detektor funktioniert. Ich versuche nicht, ein kommerzielles Produkt zu bauen, es wird eine ernsthafte Lernübung für mich sein. Daher suche ich nach Ressourcen wie vorhandenen Projekten, Quellcode, Artikeln, Artikeln usw., denen ich folgen kann. Ich möchte anhand von Beispielen lernen, ich glaube nicht, dass ich …


3
Algorithmus zur Segmentierung von Sequenzdaten
Ich habe eine große Folge von Vektoren der Länge N. Ich brauche einen unbeaufsichtigten Lernalgorithmus, um diese Vektoren in M ​​Segmente zu unterteilen. Zum Beispiel: K-means ist nicht geeignet, da es ähnliche Elemente von verschiedenen Standorten in einem einzigen Cluster zusammenfasst. Aktualisieren: Die realen Daten sehen folgendermaßen aus: Hier sehe …

1
Komplexes Chunking mit NLTK
Ich versuche herauszufinden, wie der kaskadierende Chunker von NLTK gemäß Kapitel 7 des NLTK-Buches verwendet wird . Leider stoße ich bei der Durchführung nicht trivialer Chunking-Maßnahmen auf einige Probleme. Beginnen wir mit diesem Satz: "adventure movies between 2000 and 2015 featuring performances by daniel craig" Ich kann alle relevanten NPs …
8 python  nlp  nltk 

3
Interaktive grafische Darstellung beim Protokollieren von Daten
Ich möchte grafisch darstellen und interaktiv Live- / kontinuierlich gemessene Daten untersuchen. Es gibt einige Optionen, wobei plot.ly am benutzerfreundlichsten ist. Plot.ly verfügt über eine fantastische und benutzerfreundliche Benutzeroberfläche (leicht skalierbar, pannbar, leicht zoombar / an den Bildschirm anpassbar), kann jedoch die großen Datenmengen, die ich sammle, nicht verarbeiten. Kennt …

1
Welche Klassifizierungsalgorithmen sollten Sie versuchen, um Textdaten in 300 Kategorien zu klassifizieren?
Ich habe 40000 Zeilen Textdaten der Gesundheitsdomäne. Daten haben eine Spalte für Text (2-5 Sätze) und eine Spalte für ihre Kategorie. Ich möchte das in 300 Kategorien einteilen. Einige Kategorien sind unabhängig, während andere etwas verwandt sind. Die Verteilung der Daten auf die Kategorien ist ebenfalls nicht einheitlich, dh einige …




2
Gewerkschaftsgruppierung in zweigeteilten Graphen?
Ich versuche eine gute (und schnelle) Lösung für das folgende Problem zu finden: Ich habe zwei Modelle, mit denen ich arbeite. Nennen wir sie Spieler und Teams. Ein Spieler kann in mehreren Teams sein und ein Team kann mehrere Spieler haben. Ich arbeite daran, ein UI-Element in einem Formular zu …
8 graphs 

2
Verwendung von NLP zur Automatisierung der Kategorisierung der Benutzerbeschreibung
Ich habe eine große Anzahl von Kundenbeschwerden über die Produkte, die mein Unternehmen besitzt, und ich möchte eine Datenanalyse dieser Beschreibungen durchführen und jedem von ihnen eine Kategorie zuordnen. Beispiel: Ich muss die Anzahl der Beschwerden auf der Software- und Hardwareseite meines Produkts anhand der Kundenbeschwerden ermitteln. Derzeit verwende ich …

1
R Fehler mit Paket tm (Text-Mining)
Ich versuche, das tm-Paket zu verwenden, um einen Vektor von Textzeichenfolgen in ein Korpuselement zu konvertieren. Mein Code sieht ungefähr so ​​aus Corpus(d1$Yes) Dabei d1$Yeshandelt es sich um einen Faktor mit 124 Ebenen, die jeweils eine Textzeichenfolge enthalten. Zum Beispiel, d1$Yes[246] = "So we can get the boat out!" Ich …
8 r  text-mining 



Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.