Ein Datensatz ist eine Sammlung von Daten, häufig in Tabellen- oder Matrixform. Dieses Tag ist NICHT für Datenanforderungen vorgesehen ("Wo finde ich einen Datensatz zu ...") -> siehe OpenData
Ich bin ein CS-Masterstudent im Bereich Data Mining. Mein Vorgesetzter hat mir einmal gesagt, dass ich die Daten vollständig verstehen und sicherstellen muss, dass die Daten sauber und korrekt sind, bevor ich einen Klassifikator ausführe oder etwas mit einem Datensatz mache. Meine Fragen: Was sind die Best Practices zum Verständnis …
Ich hoffe, diese Frage ist auf dieser Seite am besten geeignet ... In Python wird der Klassenname normalerweise mit dem Großbuchstaben als erstem Zeichen definiert class Vehicle: ... Im Bereich des maschinellen Lernens werden Zug- und Testdaten jedoch häufig als Xund Y- nicht xund definiert y. Zum Beispiel lese ich …
Ich muss wissen, warum wir mit Datenungleichgewichten umgehen müssen. Ich weiß, wie man damit umgeht und welche Methoden es gibt, um das Problem zu lösen: Upsampling, Downsampling oder die Verwendung von Smote. Wenn ich zum Beispiel eine seltene Krankheit habe, die 1 Prozent von 100 ausmacht, und ich mich beispielsweise …
Ich möchte das Preissetzungsverhalten von Fluggesellschaften untersuchen - insbesondere, wie Fluggesellschaften auf die Preise der Wettbewerber reagieren. Da ich sagen würde, dass mein Wissen über komplexere Analysen sehr begrenzt ist, habe ich fast alle grundlegenden Methoden angewendet, um eine Gesamtansicht der Daten zu erhalten. Dies schließt einfache Diagramme ein, die …
Weiß jemand, ob es möglich ist, ein großes Dataset von einer URL in Amazon S3 zu importieren? Grundsätzlich möchte ich vermeiden, dass eine große Datei heruntergeladen und dann über das Webportal erneut in S3 hochgeladen wird. Ich möchte nur die Download-URL für S3 bereitstellen und darauf warten, dass sie sie …
Gibt es Faustregeln (oder tatsächliche Regeln) für die minimale, maximale und "angemessene" Anzahl von LSTM-Zellen, die ich verwenden sollte? Insbesondere beziehe ich mich auf BasicLSTMCell von TensorFlow und num_unitsEigenschaft. Bitte nehmen Sie an, dass ich ein Klassifizierungsproblem habe, das definiert ist durch: t - number of time steps n - …
Hallo, Datenrahmen mit großen kategorialen Werten über 1600 Kategorien gibt es eine Möglichkeit, Alternativen zu finden, damit ich nicht über 1600 Spalten habe. Ich fand diesen unten interessanten Link http://amunategui.github.io/feature-hashing/#sourcecode Aber sie konvertieren zu Klasse / Objekt, was ich nicht will. Ich möchte meine endgültige Ausgabe als Datenrahmen, damit ich …
Ich erstelle Prototypen für eine Anwendung und benötige ein Sprachmodell, um die Ratlosigkeit einiger generierter Sätze zu berechnen. Gibt es ein geschultes Sprachmodell in Python, das ich problemlos verwenden kann? So etwas Einfaches wie model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert …
Ich habe eine Weile an maschinellem Lernen und Bioinformatik gearbeitet und heute ein Gespräch mit einem Kollegen über die wichtigsten allgemeinen Fragen des Data Mining geführt. Mein Kollege (der Experte für maschinelles Lernen ist) sagte, dass seiner Meinung nach der wohl wichtigste praktische Aspekt des maschinellen Lernens darin besteht, zu …
Es gibt viele Quellen, die die historischen Bestandsdaten liefern, aber sie liefern nur die OHLC-Felder zusammen mit dem Volumen und dem angepassten Abschluss. Einige Quellen, die ich gefunden habe, bieten auch Marktkapitalisierungsdatensätze, die jedoch auf US-Aktien beschränkt sind. Yahoo Finance stellt diese Daten online zur Verfügung, es gibt jedoch keine …
Ich bin mit einer Situation konfrontiert, in der die Anzahl der positiven und negativen Beispiele in einem Datensatz unausgewogen ist. Meine Frage ist, gibt es Faustregeln, die uns sagen, wann wir die große Kategorie unterabtasten sollten, um eine Art Ausgleich im Datensatz zu erzwingen. Beispiele: Wenn die Anzahl der positiven …
Es gibt mehrere klassische Datensätze für Klassifizierungs- / Regressionsaufgaben des maschinellen Lernens. Die beliebtesten sind: Irisblumendatensatz ; Titanic-Datensatz ; Motor Trend Cars ; usw. Aber kennt jemand ähnliche Datensätze für die Netzwerkanalyse / Graphentheorie? Konkreter - Ich suche nach Gold-Standarddatensätzen zum Vergleichen / Bewerten / Lernen: Zentralitätsmaßnahmen; Netzwerk-Clustering-Algorithmen. Ich brauche …
Ich habe die Erklärung der Faltung gelesen und verstehe sie bis zu einem gewissen Grad. Kann mir jemand helfen zu verstehen, wie diese Operation mit der Faltung in Faltungs-Neuronalen Netzen zusammenhängt? Ist eine filterähnliche Funktion, gdie Gewicht anwendet?
Ich habe zwei Tensoren a:[batch_size, dim] b:[batch_size, dim]. Ich möchte inneres Produkt für jedes Paar in der Charge machen c:[batch_size, 1], wo erzeugen c[i,0]=a[i,:].T*b[i,:]. Wie?
Geschlossen . Diese Frage muss fokussierter sein . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so, dass sie sich nur auf ein Problem konzentriert, indem Sie diesen Beitrag bearbeiten . Geschlossen vor 4 Jahren . Ich arbeite an einem Projekt und habe Schwierigkeiten …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.