Data Science

Fragen und Antworten für Data Science-Experten, Machine Learning-Spezialisten und alle, die mehr über das Feld erfahren möchten

1
Relationales Data Mining ohne ILP
Ich habe einen riesigen Datensatz aus einer relationalen Datenbank, für den ich ein Klassifizierungsmodell erstellen muss. Normalerweise würde ich für diese Situation die induktive Logikprogrammierung (ILP) verwenden, aber aufgrund besonderer Umstände kann ich das nicht tun. Die andere Möglichkeit, dies in Angriff zu nehmen, besteht darin, zu versuchen, die Werte …

4
Schlagen Sie Trainingsdatensätze für Textklassifizierer vor
Mit welchen frei verfügbaren Datensätzen kann ich einen Textklassifizierer trainieren? Wir versuchen, das Engagement unserer Benutzer zu verbessern, indem wir ihm den verwandtesten Inhalt empfehlen. Daher dachten wir, wenn wir unseren Inhalt anhand einer vordefinierten Worttasche klassifizieren, können wir ihm empfehlen, Inhalte zu nutzen, indem wir sein Feedback zu einer …

1
Wie soll man mit impliziten Daten in der Empfehlung umgehen?
Ein Empfehlungssystem führt ein Protokoll darüber, welche Empfehlungen an einen bestimmten Benutzer gerichtet wurden und ob dieser Benutzer die Empfehlung akzeptiert. Es ist wie user_id item_id result 1 4 1 1 7 -1 5 19 1 5 80 1 Dabei bedeutet 1, dass der Benutzer die Empfehlung akzeptiert hat, während …

2
Erkennung menschlicher Aktivitäten unter Verwendung eines Smartphone-Datensatzproblems
Ich bin neu in dieser Community und hoffe, dass meine Frage hier gut passt. Im Rahmen meines Bachelor-Studiengangs Datenanalyse habe ich mich für das Projekt zur Erkennung menschlicher Aktivitäten mithilfe von Smartphone-Datensätzen entschieden. Für mich bezieht sich dieses Thema auf maschinelles Lernen und die Unterstützung von Vektormaschinen. Ich bin mit …

4
Math PhD (Nonlinear Programming) wechselt zu Data Science?
Ich bin ein Mathe-Ph.D. Student, der daran interessiert ist, nach seinem Abschluss als Data Scientist in die Branche zu gehen. Ich werde kurz einige Hintergrundinformationen zu meiner Ausbildung geben, bevor ich meine Frage stelle, damit sie besser verstanden wird: Mathe-Kursarbeit: Dies geschah hauptsächlich in reiner Mathematik: Topologie, Funktionsanalyse usw., aber …


2
Priorisierte Wiedergabe, was macht Importance Sampling wirklich?
Ich kann den Zweck der Wichtigkeitsabtastung von Gewichten (IS) in der priorisierten Wiedergabe (Seite 5) nicht verstehen . Es ist wahrscheinlicher, dass ein Übergang aus der Erfahrungswiederholung entnommen wird, je höher seine "Kosten" sind. Nach meinem Verständnis hilft 'IS' dabei, die Verwendung der priorisierten Wiedergabe reibungslos aufzugeben, nachdem wir lange …

1
Unterschied zwischen interpolate () und fillna () bei Pandas
Da die Interpolations- und die Fillna-Methode die gleiche Arbeit zum Füllen von Na-Werten ausführen. Was ist der grundlegende Unterschied zwischen den beiden. Welche Bedeutung haben diese beiden unterschiedlichen Methoden? Kann mir jemand Laien erklären. Ich habe bereits die offizielle Dokumentation durchgesehen und wollte den Unterschied wissen

1
Was sind "VGG54" und "VGG22", die vom VGG19 CNN abgeleitet sind?
In der Arbeit Photo-Realistic Single Image Super-Resolution unter Verwendung eines generativen kontradiktorischen Netzwerks von Christian Ledig et al. Wird der Abstand zwischen Bildern (in der Verlustfunktion verwendet) aus Feature-Maps berechnet, die aus dem VGG19-Netzwerk extrahiert wurden. Die beiden im Artikel verwendeten werden (etwas verwirrend) VGG22 und VGG54 genannt. Was sind …


3
Verbessern Sie die Filtergeschwindigkeit des Pandas-Datenrahmens
Ich habe einen Datensatz mit 19 Spalten und ungefähr 250.000 Zeilen. Ich habe mit größeren Datensätzen gearbeitet, aber dieses Mal entschied sich Pandas, mit meinen Nerven zu spielen. Ich habe versucht, den ursprünglichen Datensatz anhand einiger einfacher Regeln in drei Unterdatenrahmen aufzuteilen. Die Ausführung des Codes dauert jedoch lange. Etwa …

1
Kann das Vertrauen in Trainingsetiketten verwendet werden, um die Vorhersagegenauigkeit zu verbessern?
Ich habe Trainingsdaten, die mit Binärwerten gekennzeichnet sind. Ich habe auch das Vertrauen jedes dieser Etiketten gesammelt, dh 0,8 Vertrauen würde bedeuten, dass 80% der menschlichen Etikettierer diesem Etikett zustimmen. Ist es möglich, diese Vertrauensdaten zu verwenden, um die Genauigkeit meines Klassifikators zu verbessern? Würde folgendes funktionieren? 1a) Wenn das …


2
So trainieren Sie das Modell, um Ereignisse 30 Minuten zuvor anhand mehrdimensionaler Zeitreihen vorherzusagen
Experten auf meinem Gebiet sind in der Lage , die Wahrscheinlichkeit eines Ereignisses (binäre Spitze in Gelb) 30 Minuten vor seinem Auftreten vorherzusagen . Die Frequenz beträgt hier 1 Sek., Diese Ansicht repräsentiert Daten im Wert von einigen Stunden. Ich habe schwarz eingekreist, wo "böswilliges" Muster sein sollte . Wechselwirkungen …

3
CNN-Speicherverbrauch
Ich möchte abschätzen können, ob ein vorgeschlagenes Modell klein genug ist, um auf einer GPU mit einer bestimmten Speichermenge trainiert zu werden Wenn ich eine einfache CNN-Architektur wie diese habe: Input: 50 x 50 x 3 C1: 32 3x3-Kernel mit Polsterung (ich denke in Wirklichkeit sind sie tatsächlich 3x3x3 angesichts …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.