Data Science

Fragen und Antworten für Data Science-Experten, Machine Learning-Spezialisten und alle, die mehr über das Feld erfahren möchten

2
Neuronale Netzwerkarchitektur zum Identifizieren von Bildkopien
Ich habe eine große Bildersammlung und möchte die Bilder in dieser Sammlung identifizieren, die andere Bilder aus der Sammlung zu kopieren scheinen. Um Ihnen einen Eindruck von den Arten von Bildpaaren zu geben, die ich als Übereinstimmungen klassifizieren möchte, betrachten Sie bitte diese Beispiele: Ich habe ungefähr 0,25 Millionen Paare …

6
Ist es ratsam, zwei Datensätze zu kombinieren?
Ich habe zwei Datensätze zur Herzfrequenz von Probanden, die an zwei verschiedenen Orten aufgezeichnet wurden (zwei verschiedene Kontinente, um genau zu sein). Die beiden Forschungsexperimente zielten darauf ab, die Emotionen der Probanden anhand der Veränderung ihrer Herzfrequenz im Laufe der Zeit zu ermitteln. Ich benutze maschinelles Lernen, um die Emotionen …

1
Was sind einige Situationen, in denen die Normalisierung der Eingabedaten auf Null bedeutet, dass die Einheitsvarianz nicht angemessen oder nicht vorteilhaft ist?
Ich habe beim maschinellen Lernen viele Male eine Normalisierung der Eingabedaten auf den Mittelwert Null und die Einheitsvarianz gesehen. Ist dies eine gute Praxis, die ständig durchgeführt werden muss, oder gibt es Zeiten, in denen dies nicht angemessen oder nicht vorteilhaft ist?


4
Merkmalsextraktion aus einem Streudiagramm
Angenommen, ich habe ein Streudiagramm wie dieses: Da ich viele Streudiagramme wie dieses habe, möchte ich eine Feature-Transformation durchführen, dh einen Squash (x,y)in einem einzelnen Term, der in ein NN eingegeben wird. Welche Transformation wie x/yoder (x/y)^2eine andere Transformation für diese Art von Diagrammen am besten geeignet ist, dh die …

1
Zielfunktion für die Klassifizierung mehrerer Etiketten
Die übliche Zielfunktion für die Klassifizierung mehrerer Etiketten (z. B. M-Etiketten) ist die binäre Kreuzentropie. Das Problem ist, wenn wir binäre Kreuzentropie verwenden, nehmen wir an, dass die Ausgabebezeichnungen unabhängig voneinander sind, was das Problem zu M unabhängigen binären Klassifizierungsproblemen macht. Gibt es eine geeignete Zielfunktion, die die Ausgabeetiketten voneinander …



1
Kann man lineare Modelle auf „Blöcken“ des Datensatzes erstellen, wenn man sie nicht auf dem gesamten Datensatz erstellen kann?
Kann man lineare Modelle auf "Blöcken" des Datensatzes erstellen, wenn man sie nicht auf dem gesamten Datensatz erstellen kann? Insbesondere habe ich noch über 88.000 Variablen (Features) übrig und man kann ohne viel Speicher nicht viel damit anfangen. Aber verlieren Modelle bei "Blöcken" die Wechselwirkungen zwischen Blöcken oder gibt es …


1
Tasche mit visuellen Wörtern
Was ich versuche zu tun: Ich versuche, einige Bilder mithilfe lokaler und globaler Funktionen zu klassifizieren. Was ich bisher gemacht habe: Ich habe für jedes Bild Siebdeskriptoren extrahiert und verwende diese als Eingabe für k-means, um mein Vokabular aus allen Merkmalen jedes Bildes zu erstellen. Von hier aus erstelle ich …

1
Wie zeichnet man Faltungsdiagramme für neuronale Netze?
Ich muss ein ähnliches CNN-Diagramm zeichnen: Ich habe alle unter https://datascience.stackexchange.com/a/14900 genannten Tools ausprobiert , aber es gibt keine einfache Möglichkeit, dies zu tun. Gibt es eine automatisierte Möglichkeit, dies zu tun? Oder muss ich es manuell machen. Ist es außerdem möglich, dies zu zeichnen?: Ich fand http://alexlenail.me/NN-SVG/LeNet.html , in …

3
Wie kann man Cluster schön plotten?
Ich habe einen großen Textdatensatz geclustert. Jeder Cluster wird durch einen Schwerpunkt der dazugehörigen vektorisierten Texte, die Anzahl der Texte, das Erstellungsdatum und andere Parameter dargestellt. Ich kann die Cluster nicht in einem n-dimensionalen Raum darstellen. Welche Möglichkeiten habe ich?

2
Migration von R zu Python: spezifische Fragen
Ich habe R und RStudio für Prototyping und Modellbildung verwendet und aufgrund einiger anhaltender Probleme (die nur für die Umgebung gelten würden, in der ich sie verwende) haben wir uns für Python entschieden. Ich möchte wissen: Gibt es eine Python-Entwicklungsumgebung wie "RStudio Server"? Wie einfach / schwer ist es, Multi-Threading …

1
Überschreiten Deep-Learning-Modelle die erforderliche Kapazität für die geschätzten Entropien ihrer Datensätze?
Diese Frage mag etwas seltsam erscheinen. Ich machte einige Selbststudien zur Informationstheorie und beschloss, weitere formale Untersuchungen zum Deep Learning durchzuführen. Bitte nehmen Sie mit, wenn ich versuche zu erklären. Ich nahm eine große "Trainings" -Untergruppe von MNIST als mein Meerschweinchen. 1) Konvertierte jedes Bild in MNIST in "Schwarzweiß" (Pixelwerte …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.