Data Science

Fragen und Antworten für Data Science-Experten, Machine Learning-Spezialisten und alle, die mehr über das Feld erfahren möchten




2
Unterschied zwischen Trainings- und Testdatenverteilung
Eine Grundannahme beim maschinellen Lernen ist, dass Trainings- und Testdaten aus derselben Population stammen und somit derselben Verteilung folgen. In der Praxis ist dies jedoch höchst unwahrscheinlich. Covariate Shift behebt dieses Problem. Kann jemand die folgenden Zweifel daran klären? Wie prüft man, ob zwei Verteilungen statistisch unterschiedlich sind? Kann die …


3
Vorlagen mit Parametern in Textfragmenten identifizieren
Ich habe einen Datensatz mit Textfragmenten mit einer festen Struktur, die Parameter enthalten kann. Beispiele sind: Temperature today is 20 centigrades Temperature today is 28 centigrades oder Her eyes are blue and hair black. Her eyes are green and hair brown. Das erste Beispiel zeigt eine Vorlage mit einem numerischen …

2
Theoretische Grenze - Regressionsfehler
Die Bayes-Fehlerrate ist eine theoretische Grenze, die anhand einiger Daten die niedrigstmögliche Fehlerrate für ein Klassifizierungsproblem bestimmt. Ich habe mich gefragt, ob es für den Fall von Regressionsalgorithmen ein äquivalentes Konzept gibt. Mein Ziel ist es zu bestimmen, wie weit der Fehler meines Regressionsalgorithmus von dieser theoretischen Grenze entfernt ist, …

1
Projizieren von Daten von nach
Ich habe wenige Punkte in , dh die in eingebettete dimensionale Einheitskugel , und ich möchte sie auf , dh die 2-dimensionale , projizieren Einheitskugel (eingebettet in ), um sie mit der Einschränkung zu visualisieren, dass benachbarte Punkte in der Nähe sein sollten. Ich habe einige Zeit mit t-sne gespielt, …

1
Warum gibt die logistische Regression in Spark und R unterschiedliche Modelle für dieselben Daten zurück?
Ich habe die logistischen Regressionsmodelle für R ( glm) und Spark ( LogisticRegressionWithLBFGS) mit einem Datensatz von 390 obs verglichen . von 14 Variablen. Die Ergebnisse sind im Achsenabschnitt und in den Gewichten völlig unterschiedlich. Wie kann man das erklären? Hier sind die Ergebnisse von Spark (LogisticRegressionWithLBFGS): model.intercept : 1.119830027739959 …



1
Wie vergleicht sich SQL Server Analysis Services mit R?
Dies mag eine zu weit gefasste Frage mit starken Meinungen sein, aber es fällt mir wirklich schwer, Informationen über das Ausführen verschiedener Algorithmen mit SQL Server Analysis Service-Data-Mining-Projekten im Vergleich zu R zu finden. Dies liegt hauptsächlich daran, dass alle Data-Science-Mitarbeiter mit mir zusammenarbeiten Ich habe keine Ahnung von SSAS, …


1
Wie extrahiere ich Funktionen und klassifiziere Warn-E-Mails, die von Überwachungstools stammen, in die richtige Kategorie?
Mein Unternehmen bietet vielen seiner Kunden Managed Services an. Unsere Kunden verwenden normalerweise die folgenden Überwachungstools, um ihre Server / Webanwendungen zu überwachen: OpsView Nagios Pingdom Benutzerdefinierte Shell-Skripte Immer wenn ein Problem gefunden wird, geht eine Benachrichtigungsmail an unser Ops-Team, damit es das Problem beheben kann. Da wir Tausende von …


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.