Data Science

Fragen und Antworten für Data Science-Experten, Machine Learning-Spezialisten und alle, die mehr über das Feld erfahren möchten

1
Unvorhersehbarkeit oder Unsicherheit in einer Zeitreihe finden
Ich bin daran interessiert, eine Statistik zu finden, die die Unvorhersehbarkeit einer Zeitreihe erfasst. Nehmen Sie der Einfachheit halber an, dass jeder Wert in der Zeitreihe entweder 1 oder 0 ist. So sind beispielsweise die folgenden zwei Zeitreihen vollständig vorhersehbar. TS1: 1 1 1 1 1 1 1 1 TS2: …

2
Lambda-Architektur - Implementieren der Zusammenführungs- / Abfrageebene
Ich lese über Lambda-Architektur. Es ergibt Sinn. Wir haben warteschlangenbasierte Datenaufnahme. Wir haben einen In-Memory-Speicher für Daten, der sehr neu ist, und wir haben HDFS für alte Daten. Wir haben also unseren gesamten Datensatz. in unserem System. sehr gut. Das Architekturdiagramm zeigt jedoch, dass die Zusammenführungsschicht sowohl die Batch-Schicht als …

1
Wie geht der naive Bayes-Klassifikator mit fehlenden Daten im Training um?
Naive Bayes geht offenbar unterschiedlich mit fehlenden Daten um, je nachdem, ob sie in Trainings- oder Test- / Klassifizierungsinstanzen vorhanden sind. Bei der Klassifizierung von Instanzen wird das Attribut mit dem fehlenden Wert einfach nicht in die Wahrscheinlichkeitsberechnung einbezogen ( http://www.inf.ed.ac.uk/teaching/courses/iaml/slides/naive-2x2.pdf ). Im Training "ist die Instanz [mit den fehlenden …

1
Bitte klären Sie mich mit Platt's SMO-Algorithmus (für SVM) auf.
Aus A_Roadmap_to_SVM_SMO.pdf , S. 12. (Quelle: postimg.org ) Angenommen, ich verwende einen linearen Kernel. Wie kann ich sowohl das erste als auch das zweite innere Produkt erhalten? Meine Vermutung, inneres Produkt von Datenpunkt mit Datenpunkt j bezeichnet Klasse A für das erste innere Produkt der Gleichung und inneres Produkt von …
7 svm 


5
Wo soll man in neuronalen Netzen anfangen?
Zunächst einmal weiß ich, dass die Frage möglicherweise nicht für die Website geeignet ist, aber ich würde es wirklich begrüßen, wenn Sie mir nur einige Hinweise geben würden. Ich bin ein 16-jähriger Programmierer, habe Erfahrung mit vielen verschiedenen Programmiersprachen. Vor einiger Zeit habe ich einen Kurs bei Coursera mit dem …



1
Verwenden von Apache Spark für ML. Immer wieder Serialisierungsfehler
Daher verwende ich Spark für die Stimmungsanalyse und erhalte immer wieder Fehler mit den Serialisierern, die (glaube ich) zum Weitergeben von Python-Objekten verwendet werden. PySpark worker failed with exception: Traceback (most recent call last): File "/Users/abdul/Desktop/RSI/spark-1.0.1-bin- hadoop1/python/pyspark/worker.py", line 77, in main serializer.dump_stream(func(split_index, iterator), outfile) File "/Users/abdul/Desktop/RSI/spark-1.0.1-bin- hadoop1/python/pyspark/serializers.py", line 191, in …

6
Welcher Kreuzvalidierungstyp eignet sich am besten für das Problem der binären Klassifizierung?
Datensatz sieht aus wie: 25000 Beobachtungen Bis zu 15 Prädiktoren verschiedener Typen: numerisch, kategorial für mehrere Klassen, binär Zielvariable ist binär Welche Kreuzvalidierungsmethode ist typisch für diese Art von Problemen? Standardmäßig verwende ich K-Fold. Wie viele Falten reichen in diesem Fall aus? (Eines der Modelle, die ich benutze, ist zufällige …

1
Umgang mit verschiedenen Textdaten
Ich arbeite derzeit mit einem Datensatz mit einer Vielzahl von Dokumentlängen - von einem einzelnen Wort bis zu einer ganzen Textseite. Darüber hinaus variieren die grammatikalische Struktur und die Verwendung von Interpunktion von Dokument zu Dokument erheblich. Ziel ist es, diese Dokumente in eine von etwa 10 bis 15 Kategorien …



1
CNN oder Viola-Jones zur Gesichtserkennung
Ich habe mich gefragt, da CNNs jede bildbezogene Aufgabe dominiert haben. Wird der Viola-Jones-Gesichtsdetektor immer noch als Stand der Technik angesehen oder haben CNNs seine Leistung übertroffen?
6 convnet 


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.