Statistiken und Big Data classification

1

So bereiten Sie Daten für die Eingabe in ein spärliches kategoriales Cross-Entropy-Multiklassifizierungsmodell vor [geschlossen]

Geschlossen. Diese Frage ist nicht zum Thema . Derzeit werden keine Antworten akzeptiert. Möchten Sie diese Frage verbessern? Aktualisieren Sie die Frage so dass es beim Thema für Kreuz Validated. Geschlossen vor 2 Jahren . Ich habe also eine Reihe von Tweets mit ein paar Spalten wie Datum und Tweet …

7 classification python data-preprocessing keras

3

Ganzzahlige Daten: kategorisch oder kontinuierlich?

Ich frage mich, ob ganzzahlige Prädiktordaten als kategorisch (daher codierungsbedürftig) oder kontinuierlich behandelt werden sollten. Wenn der Bereich eines bestimmten Prädiktors Xbeispielsweise alle Ganzzahlen zwischen 1 und 230 sind, kann ich ihn dann als kontinuierliche Variable behandeln oder sollte ich ihn codieren, um 230 (oder vielleicht 229) neue Dummy-Variablen zu …

7 regression classification categorical-data continuous-data

3

Verwenden von PCA für einen Bilddatensatz vor der Klassifizierung mit einem neuronalen Netzwerk

Ich habe eine Bilddatenmatrix X∈RN x pX∈ℜN x pX \in \Re^{N \ \text{x}\ p} wo N=50000N=50000N=50000 ist die Anzahl der Bildbeispiele und p=3072p=3072p=3072 ist die Anzahl der Bildpixel: p=3072=32×32×3p=3072=32×32×3p = 3072 = 32 \times 32 \times 3, weil jedes Bild ein 3-Kanal ist 32×3232×3232 \times 32Bild. Darüber hinaus gehört jedes …

7 machine-learning classification neural-networks pca image-processing

1

Sollten wir den Intercept-Term bei der Kernelisierung von Algorithmen berücksichtigen?

Wenn ein Lernalgorithmus (z. B. Klassifizierung, Regression, Clustering oder Dimensionsreduktion) nur das Punktprodukt zwischen Datenpunkten verwendet xxT.xxT.\mathbf {x x^T} Wir können implizit eine höherdimensionale Abbildung verwenden ϕ ( x )ϕ(x)\phi(\mathbf x) Durch den Kernel-Trick wird jede Instanz ausgetauscht, in der das Punktprodukt vom Kernel auftritt K =ϕ( x )ϕ( x)T.K.=ϕ(x)ϕ(x)T.\mathbf …

7 regression machine-learning classification kernel-trick

1

Was ist der Mittelwert Null und die Einheitsvarianz in Bezug auf Bilddaten?

Ich bin neu im tiefen Lernen. Ich versuche einige Konzepte zu verstehen. Ich weiß, dass "Mittelwert" ein Durchschnittswert ist und "Varianz" eine Abweichung vom Mittelwert ist. Ich habe einige Forschungsarbeiten gelesen, alle sagen, dass wir unsere Daten zuerst vorverarbeiten. Aber wie hängen diese Konzepte mit der Bildvorverarbeitung zusammen? Warum werden …

7 classification variance mean deep-learning image-processing

2

Wie kann man Boxplots verwenden, um den Punkt zu finden, an dem Werte eher von unterschiedlichen Bedingungen stammen?

Ich habe einige Daten mithilfe von Boxplots aufgezeichnet. Ich vergleiche die Werte von Bedingung 1 (links) und Bedingung 2 (rechts). Mein Ziel ist es, einen Punkt zu finden, an dem wir eine Entscheidung treffen, bei der sich der Wert von Punkt Bedingung 1 zu Bedingung 2 ändert. Ist diese Schlussfolgerung …

7 r logistic classification data-visualization boxplot

1

Zufälliger Wald: Klassenspezifische Merkmalsbedeutung

Ich benutze das bigrfR-Paket, um einen Datensatz mit ca. zu analysieren. 50.000 Beobachtungen x 120 Variablen, klassifiziert in zwei Gruppen. Nachdem ich einen Wald mit 1000 Bäumen gezüchtet habe, untersuche ich die Bedeutung und Beziehung der 120 Merkmale in Bezug auf die beiden Klassen mit den Funktionen fastimpund interactions, die …

7 r classification feature-selection random-forest

1

Die verschiedenen Formulierungen für SVM verstehen

Ich arbeite kernlabjetzt seit mehr als einem Jahr mit, aber ich habe mich bei der C-svcKlassifizierung immer an die Vanilla cost ( ) -Formulierung gehalten . kernlabEnthält natürlich einige andere Formulierungen. Im Handbuch werden einige Klassifizierungsformulierungen kurz zitiert. Ich bin ziemlich vertraut mit Vanille Cost Svms. Zum Beispiel kenne ich …

7 classification svm statistical-learning

1

Vowpal Wabbit: Beste Strategie für kurze Textdaten wie Titel und Kewords

Ich verwende Vowpal Wabbit 7.10.0 (VW), um Kategorien für Textdaten zu lernen und vorherzusagen. Meine Textdaten für jeden Datensatz ähneln jedoch nicht einem Artikel oder einem anderen Textdokument mit anständiger Größe, sondern einigen Sätzen wie Titel, Untertitel und Schlüsselwörtern. Ich habe ungefähr 10.000 beschriftete Datensätze, die ich für die Validierung, …

7 classification multi-class vowpal-wabbit

Als «classification» getaggte Fragen