Data Science

1

Ich habe einen riesigen Datensatz aus einer relationalen Datenbank, für den ich ein Klassifizierungsmodell erstellen muss. Normalerweise würde ich für diese Situation die induktive Logikprogrammierung (ILP) verwenden, aber aufgrund besonderer Umstände kann ich das nicht tun. Die andere Möglichkeit, dies in Angriff zu nehmen, besteht darin, zu versuchen, die Werte …

9 data-mining classification relational-dbms

4

Schlagen Sie Trainingsdatensätze für Textklassifizierer vor

Mit welchen frei verfügbaren Datensätzen kann ich einen Textklassifizierer trainieren? Wir versuchen, das Engagement unserer Benutzer zu verbessern, indem wir ihm den verwandtesten Inhalt empfehlen. Daher dachten wir, wenn wir unseren Inhalt anhand einer vordefinierten Worttasche klassifizieren, können wir ihm empfehlen, Inhalte zu nutzen, indem wir sein Feedback zu einer …

9 machine-learning classification dataset clustering text-mining

1

Wie soll man mit impliziten Daten in der Empfehlung umgehen?

Ein Empfehlungssystem führt ein Protokoll darüber, welche Empfehlungen an einen bestimmten Benutzer gerichtet wurden und ob dieser Benutzer die Empfehlung akzeptiert. Es ist wie user_id item_id result 1 4 1 1 7 -1 5 19 1 5 80 1 Dabei bedeutet 1, dass der Benutzer die Empfehlung akzeptiert hat, während …

9 recommender-system

2

Erkennung menschlicher Aktivitäten unter Verwendung eines Smartphone-Datensatzproblems

Ich bin neu in dieser Community und hoffe, dass meine Frage hier gut passt. Im Rahmen meines Bachelor-Studiengangs Datenanalyse habe ich mich für das Projekt zur Erkennung menschlicher Aktivitäten mithilfe von Smartphone-Datensätzen entschieden. Für mich bezieht sich dieses Thema auf maschinelles Lernen und die Unterstützung von Vektormaschinen. Ich bin mit …

9 bigdata machine-learning databases clustering data-mining

4

Math PhD (Nonlinear Programming) wechselt zu Data Science?

Ich bin ein Mathe-Ph.D. Student, der daran interessiert ist, nach seinem Abschluss als Data Scientist in die Branche zu gehen. Ich werde kurz einige Hintergrundinformationen zu meiner Ausbildung geben, bevor ich meine Frage stelle, damit sie besser verstanden wird: Mathe-Kursarbeit: Dies geschah hauptsächlich in reiner Mathematik: Topologie, Funktionsanalyse usw., aber …

9 machine-learning deep-learning data-cleaning data-analysis reference-request

2

Wie berechne ich die Vorhersagewahrscheinlichkeit einer Klasse in Java Weka Api?

Ich entwickle ein Vorhersagemodell mit Java Weka API. Ich kann die Klasse für die neue Instanz mit dem folgenden Code vorhersagen: double predictClass = classifer.classifyInstance(instance) Ich benötige jedoch eine Klassenwahrscheinlichkeit anstelle eines Klassenwerts. Danke im Voraus für deine Unterstützung.

9 classification java weka

2

Priorisierte Wiedergabe, was macht Importance Sampling wirklich?

Ich kann den Zweck der Wichtigkeitsabtastung von Gewichten (IS) in der priorisierten Wiedergabe (Seite 5) nicht verstehen . Es ist wahrscheinlicher, dass ein Übergang aus der Erfahrungswiederholung entnommen wird, je höher seine "Kosten" sind. Nach meinem Verständnis hilft 'IS' dabei, die Verwendung der priorisierten Wiedergabe reibungslos aufzugeben, nachdem wir lange …

9 reinforcement-learning

1

Unterschied zwischen interpolate () und fillna () bei Pandas

Da die Interpolations- und die Fillna-Methode die gleiche Arbeit zum Füllen von Na-Werten ausführen. Was ist der grundlegende Unterschied zwischen den beiden. Welche Bedeutung haben diese beiden unterschiedlichen Methoden? Kann mir jemand Laien erklären. Ich habe bereits die offizielle Dokumentation durchgesehen und wollte den Unterschied wissen

9 python bigdata pandas jupyter

1

Was sind "VGG54" und "VGG22", die vom VGG19 CNN abgeleitet sind?

In der Arbeit Photo-Realistic Single Image Super-Resolution unter Verwendung eines generativen kontradiktorischen Netzwerks von Christian Ledig et al. Wird der Abstand zwischen Bildern (in der Verlustfunktion verwendet) aus Feature-Maps berechnet, die aus dem VGG19-Netzwerk extrahiert wurden. Die beiden im Artikel verwendeten werden (etwas verwirrend) VGG22 und VGG54 genannt. Was sind …

9 deep-learning cnn gan

2

Wie können Autoencoder für das Clustering verwendet werden?

Angenommen, ich habe eine Reihe von Zeitbereichssignalen ohne Beschriftung . Ich möchte sie in 2 oder 3 Klassen gruppieren. Autoencoder sind unbeaufsichtigte Netzwerke, die lernen, die Eingänge zu komprimieren. also eine Eingabe , und , und und ausgegeben wird , können wir die folgenden Beziehungen finden:x( i )x(i)x^{(i)}W 2 b …

9 neural-network clustering time-series unsupervised-learning autoencoder

3

Verbessern Sie die Filtergeschwindigkeit des Pandas-Datenrahmens

Ich habe einen Datensatz mit 19 Spalten und ungefähr 250.000 Zeilen. Ich habe mit größeren Datensätzen gearbeitet, aber dieses Mal entschied sich Pandas, mit meinen Nerven zu spielen. Ich habe versucht, den ursprünglichen Datensatz anhand einiger einfacher Regeln in drei Unterdatenrahmen aufzuteilen. Die Ausführung des Codes dauert jedoch lange. Etwa …

9 python pandas performance

1

Kann das Vertrauen in Trainingsetiketten verwendet werden, um die Vorhersagegenauigkeit zu verbessern?

Ich habe Trainingsdaten, die mit Binärwerten gekennzeichnet sind. Ich habe auch das Vertrauen jedes dieser Etiketten gesammelt, dh 0,8 Vertrauen würde bedeuten, dass 80% der menschlichen Etikettierer diesem Etikett zustimmen. Ist es möglich, diese Vertrauensdaten zu verwenden, um die Genauigkeit meines Klassifikators zu verbessern? Würde folgendes funktionieren? 1a) Wenn das …

9 machine-learning classification regression scikit-learn svm

8

Unterschied zwischen maschinellem Lernen und künstlicher Intelligenz

Meine Frage lautet: Gibt es einen Unterschied zwischen maschinellem Lernen und künstlicher Intelligenz? Oder beziehen sich diese Begriffe auf dasselbe?

9 machine-learning theory

2

So trainieren Sie das Modell, um Ereignisse 30 Minuten zuvor anhand mehrdimensionaler Zeitreihen vorherzusagen

Experten auf meinem Gebiet sind in der Lage , die Wahrscheinlichkeit eines Ereignisses (binäre Spitze in Gelb) 30 Minuten vor seinem Auftreten vorherzusagen . Die Frequenz beträgt hier 1 Sek., Diese Ansicht repräsentiert Daten im Wert von einigen Stunden. Ich habe schwarz eingekreist, wo "böswilliges" Muster sein sollte . Wechselwirkungen …

9 machine-learning python predictive-modeling time-series scikit-learn

3

CNN-Speicherverbrauch

Ich möchte abschätzen können, ob ein vorgeschlagenes Modell klein genug ist, um auf einer GPU mit einer bestimmten Speichermenge trainiert zu werden Wenn ich eine einfache CNN-Architektur wie diese habe: Input: 50 x 50 x 3 C1: 32 3x3-Kernel mit Polsterung (ich denke in Wirklichkeit sind sie tatsächlich 3x3x3 angesichts …

9 machine-learning neural-network convnet parameter-estimation gpu