Data Science

2

Sparse_categorical_crossentropy vs categorical_crossentropy (Keras, Genauigkeit)

Was ist besser für die Genauigkeit oder sind sie gleich? Wenn Sie categorical_crossentropy verwenden, verwenden Sie natürlich eine heiße Codierung, und wenn Sie sparse_categorical_crossentropy verwenden, codieren Sie als normale Ganzzahlen. Und wann ist einer besser als der andere?

19 neural-network keras loss-function encoding

3

Datensatz für die Erkennung benannter Entitäten in informellem Text

Ich suche derzeit nach beschrifteten Datensätzen, um ein Modell zu trainieren, um benannte Entitäten aus informellem Text zu extrahieren (ähnlich wie Tweets). Da in den Dokumenten in meinem Datensatz häufig Groß- und Kleinschreibung und Grammatik fehlen, suche ich nach Daten außerhalb des Bereichs, die ein bisschen "informeller" sind als die …

18 dataset nlp

4

Wie kommentiere ich Textdokumente mit Metadaten?

Welche Möglichkeiten gibt es, Textdokumente (in natürlicher Sprache, unstrukturiert) mit semantischen Metadaten zu versehen? Betrachten Sie zum Beispiel ein kurzes Dokument: I saw the company's manager last day. Um Informationen daraus extrahieren zu können, müssen sie mit zusätzlichen Daten versehen werden, damit sie nicht mehr eindeutig sind. Das Auffinden solcher …

18 nlp metadata data-cleaning text-mining

3

Wie lässt sich die Algorithmusentwicklung skalieren?

Wenn ich an der explorativen Datenanalyse arbeite und Algorithmen entwickle, verbringe ich den größten Teil meiner Zeit mit Visualisieren, Schreiben von Code, Ausführen eines kleinen Datensatzes und Wiederholen. Bei den Daten handelt es sich in der Regel um Computer-Vision- / Sensor-Fusion-Daten, und Algorithmen sind sehr visuell (z. B. Objekterkennung und …

18 algorithms

1

Was sind die Vor- und Nachteile von Keras und TFLearn?

Was sind die Vor- und Nachteile von Keras und TFlearn ? Wann wird eine Bibliothek der anderen vorgezogen?

18 machine-learning keras tflearn

1

Word2Vec vs.

Ich kam vor kurzem in den Bedingungen Word2Vec , Sentence2Vec und Doc2Vec und Art verwirrt wie ich bin neu in Vektor - Semantik. Kann jemand bitte die Unterschiede in diesen Methoden in einfachen Worten erläutern. Was sind die am besten geeigneten Aufgaben für jede Methode?

18 machine-learning data-mining clustering nlp unsupervised-learning

3

Python-Implementierung der Kostenfunktion in der logistischen Regression: Warum Punktmultiplikation in einem Ausdruck, aber elementweise Multiplikation in einem anderen?

Ich habe eine sehr grundlegende Frage, die sich auf Python, Numpy und Multiplikation von Matrizen im Rahmen der logistischen Regression bezieht. Lassen Sie mich zunächst entschuldigen, dass ich keine mathematische Notation verwende. Ich bin verwirrt über die Verwendung der Matrixpunktmultiplikation gegenüber der elementweisen Multiplikation. Die Kostenfunktion ist gegeben durch: Und …

18 python logistic-regression cost-function

1

Wie gehe ich mit String-Labels in der Mehrklassenklassifikation mit Keras um?

Ich bin Neuling in maschinellem Lernen und Keras und arbeite jetzt an einem Problem der Klassifizierung von Bildern mit Keras. Die Eingabe ist Bild markiert. Nach einer gewissen Vorverarbeitung werden die Trainingsdaten in der Python-Liste wie folgt dargestellt: [["dog", "path/to/dog/imageX.jpg"],["cat", "path/to/cat/imageX.jpg"], ["bird", "path/to/cat/imageX.jpg"]] Die Klassenbezeichnungen lauten "Hund", "Katze" und "Vogel". …

18 machine-learning scikit-learn tensorflow keras encoding

1

Sind t-sne-Dimensionen sinnvoll?

Gibt es Bedeutungen für die Dimensionen einer t-sne Einbettung? Wie bei PCA haben wir diesen Sinn für linear transformierte Varianzmaximierungen, aber für t-sne gibt es neben dem Raum, den wir für die Abbildung und Minimierung des KL-Abstands definieren, auch Intuition?

18 dimensionality-reduction tsne

1

Möglichkeiten, mit Längen- und Breitengrad umzugehen [geschlossen]

Geschlossen . Diese Frage erfordert Details oder Klarheit . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Fügen Sie Details hinzu und klären Sie das Problem, indem Sie diesen Beitrag bearbeiten . Geschlossen vor 3 Jahren . Ich arbeite an einem fiktiven Datensatz mit 25 Funktionen. Zwei der …

18 machine-learning python feature-engineering feature-scaling normalization

4

Wann würde man die Entfernung von Manhattan im Gegensatz zur euklidischen Entfernung verwenden?

Ich versuche nach einem guten Argument zu suchen, warum man beim maschinellen Lernen die Manhattan-Distanz über die euklidische Distanz verwenden sollte . Das Nächste, was ich bisher zu einem guten Argument gefunden habe, ist diese MIT-Vorlesung . Um 36:15 Uhr sehen Sie auf den Folien die folgende Aussage: "Verwenden Sie …

18 machine-learning classification distance

4

Was ist der Unterschied zwischen Inception v2 und Inception v3?

Das Paper Going Deeper With Convolutions beschreibt GoogleNet, das die ursprünglichen Inception-Module enthält: Die Änderung zu Inception v2 bestand darin, dass sie die 5x5-Faltungen durch zwei aufeinanderfolgende 3x3-Faltungen ersetzten und Pooling anwendeten: Was ist der Unterschied zwischen Inception v2 und Inception v3?

18 image-classification convnet computer-vision inception

3

Richtlinien zur Auswahl eines Optimierers für das Training neuronaler Netze

Ich benutze seit einiger Zeit neuronale Netze. Eine Sache, mit der ich ständig zu kämpfen habe, ist die Auswahl eines Optimierers zum Trainieren des Netzwerks (mit Backprop). Normalerweise beginne ich einfach mit einem (zB Standard-SGD) und versuche es dann ziemlich zufällig mit anderen. Ich habe mich gefragt, ob es einen …

18 neural-network optimization backpropagation

2

Welche Standardfilter werden von Keras Convolution2d () verwendet?

Ich bin ziemlich neu in neuronalen Netzen, aber ich verstehe die lineare Algebra und die Faltungsmathematik ziemlich gut. Ich versuche, den Beispielcode zu verstehen, den ich an verschiedenen Stellen im Internet finde, um eine Keras-Faltungs-NN mit MNIST-Daten zu trainieren, um Ziffern zu erkennen. Meine Erwartung wäre, dass ich beim Erstellen …

18 convnet keras

3

Gibt es ein Tool zum Aufräumen von Daten für Python / Pandas, das dem Tool R tidyr ähnelt?

Ich arbeite an einer Kaggle-Herausforderung, bei der einige Variablen durch Zeilen anstelle von Spalten dargestellt werden (Telstra Network Disruption). Ich bin derzeit auf der Suche nach dem Äquivalent von gather (), separate () und spread (), die in R Tidyr Tool gefunden werden können.

18 r python dataset data-cleaning pandas