Als «r» getaggte Fragen

R ist eine kostenlose Open-Source-Programmiersprache und Softwareumgebung für statistische Berechnungen, Bioinformatik und Grafik.


2
Informationsgewinn in R.
Ich habe Pakete gefunden, die zur Berechnung des "Informationsgewinns" zur Auswahl der Hauptattribute in C4.5 Decision Tree verwendet werden, und ich habe versucht, sie zur Berechnung des "Informationsgewinns" zu verwenden. Die Ergebnisse der Berechnung der einzelnen Pakete unterscheiden sich jedoch wie im folgenden Code. > IG.CORElearn <- attrEval(In_Occu ~ In_Temp+In_Humi+In_CO2+In_Illu+In_LP+Out_Temp+Out_Humi, …


4
Klassifizieren von E-Mails in R.
Ich arbeite an einem Projekt in R, in dem ich ungefähr 1200 E-Mails von einem Unternehmen habe, von denen die meisten als Klasse 1 oder Klasse 2 gekennzeichnet sind. Dies sind die Arten von Anfragen. Ungefähr 1000 E-Mails sind mit Klasse und 200 mit Klasse Mein Ziel ist es, mithilfe …

3
So finden Sie Ähnlichkeiten zwischen verschiedenen Faktoren in einem Datensatz
Einführung Angenommen, ich habe einen Datensatz mit unterschiedlichen Beobachtungen verschiedener Personen und möchte Personen zusammenfassen, um zu wissen, welche Person der anderen am nächsten ist. Ich möchte auch ein Maß dafür haben, wie nahe sie beieinander sind und welche statistische Signifikanz sie haben. Daten eat_rate drink_rate sleep_rate play_rate name game …

2
Der beste Weg, um große Datenmengen mit R von Twitter zu speichern?
Ich arbeite an einem Projekt, das darauf abzielt, einen großen Datensatz (dh Tweet-Daten, die ein paar Tage alt sind) von Twitter mithilfe der twitteR-Bibliothek auf R. abzurufen. Es ist schwierig, Tweets zu speichern, da mein Computer nur über 8 GB Speicher verfügt . Es ging der Speicher aus, noch bevor …
8 r  dataset 

2
Visualisieren Sie ein horizontales Box-Diagramm in R.
Ich habe einen solchen Datensatz. Die Daten wurden über einen Fragebogen gesammelt und ich werde eine explorative Datenanalyse durchführen. windows <- c("yes", "no","yes","yes","no") sql <- c("no","yes","no","no","no") excel <- c("yes","yes","yes","no","yes") salary <- c(100,200,300,400,500 ) test<- as.data.frame (cbind(windows,sql,excel,salary),stringsAsFactors=TRUE) test[,"salary"] <- as.numeric(as.character(test[,"salary"] )) Ich habe eine Ergebnisvariable (Gehalt) in meinem Datensatz und einige …


1
R Fehler mit Paket tm (Text-Mining)
Ich versuche, das tm-Paket zu verwenden, um einen Vektor von Textzeichenfolgen in ein Korpuselement zu konvertieren. Mein Code sieht ungefähr so ​​aus Corpus(d1$Yes) Dabei d1$Yeshandelt es sich um einen Faktor mit 124 Ebenen, die jeweils eine Textzeichenfolge enthalten. Zum Beispiel, d1$Yes[246] = "So we can get the boat out!" Ich …
8 r  text-mining 


2
Empfehlungssystem basierend auf Kaufhistorie, nicht Bewertungen
Ich untersuche Optionen für Empfehlungssysteme, die für die Versicherungsbranche optimiert sind und die dies berücksichtigen würden i) Produktbestände ii) Benutzereigenschaften (Segment, Alter, Wohlstand usw.). Ich möchte das betonen a) Es sind keine Produktbewertungen verfügbar, daher ist eine kollaborative Filterung keine Option b) empfohlene Produkte müssen nicht mit bereits gekauften Produkten …

3
Vorlagen mit Parametern in Textfragmenten identifizieren
Ich habe einen Datensatz mit Textfragmenten mit einer festen Struktur, die Parameter enthalten kann. Beispiele sind: Temperature today is 20 centigrades Temperature today is 28 centigrades oder Her eyes are blue and hair black. Her eyes are green and hair brown. Das erste Beispiel zeigt eine Vorlage mit einem numerischen …

1
Warum gibt die logistische Regression in Spark und R unterschiedliche Modelle für dieselben Daten zurück?
Ich habe die logistischen Regressionsmodelle für R ( glm) und Spark ( LogisticRegressionWithLBFGS) mit einem Datensatz von 390 obs verglichen . von 14 Variablen. Die Ergebnisse sind im Achsenabschnitt und in den Gewichten völlig unterschiedlich. Wie kann man das erklären? Hier sind die Ergebnisse von Spark (LogisticRegressionWithLBFGS): model.intercept : 1.119830027739959 …

1
Wie vergleicht sich SQL Server Analysis Services mit R?
Dies mag eine zu weit gefasste Frage mit starken Meinungen sein, aber es fällt mir wirklich schwer, Informationen über das Ausführen verschiedener Algorithmen mit SQL Server Analysis Service-Data-Mining-Projekten im Vergleich zu R zu finden. Dies liegt hauptsächlich daran, dass alle Data-Science-Mitarbeiter mit mir zusammenarbeiten Ich habe keine Ahnung von SSAS, …


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.