Das R data.table-Paket ist eine Erweiterung von data.frame, die für eine schnelle speicherinterne Datenanalyse entwickelt wurde. Verwenden Sie das dt-Tag für das DataTables-Paket mit Shiny (DT).
Ich habe ein Problem bei der Verwendung von data.table: Wie konvertiere ich Spaltenklassen? Hier ein einfaches Beispiel: Mit data.frame habe ich kein Problem beim Konvertieren, mit data.table weiß ich einfach nicht wie: df <- data.frame(ID=c(rep("A", 5), rep("B",5)), Quarter=c(1:5, 1:5), value=rnorm(10)) #One way: http://stackoverflow.com/questions/2851015/r-convert-data-frame-columns-from-factors-to-characters df <- data.frame(lapply(df, as.character), stringsAsFactors=FALSE) #Another way …
Ich verwende data.table und es gibt viele Funktionen, bei denen ich einen Schlüssel setzen muss (z X[Y]. B. ). Daher möchte ich verstehen, was ein Schlüssel tut, um Schlüssel in meinen Datentabellen richtig festzulegen. Eine Quelle, die ich las, war ?setkey. setkey()sortiert a data.tableund markiert es als sortiert. Die sortierten …
In R habe ich eine Operation, die Infbeim Transformieren eines Datenrahmens einige Werte erstellt. Ich möchte diese InfWerte in NAWerte verwandeln . Der Code, den ich habe, ist für große Datenmengen langsam. Gibt es eine schnellere Möglichkeit, dies zu tun? Angenommen, ich habe den folgenden Datenrahmen: dat <- data.frame(a=c(1, Inf), …
Hier ist ein Beispieldatenrahmen: d <- data.frame( x = runif(90), grp = gl(3, 30) ) Ich möchte die Teilmenge dder Zeilen mit den Top 5 Werten von xfür jeden Wert von grp. Mit base-R wäre mein Ansatz ungefähr so: ordered <- d[order(d$x, decreasing = TRUE), ] splits <- split(ordered, ordered$grp) …
Wenn ich dplyr Syntax auf eine Datentabelle , erhalte ich alle die Geschwindigkeitsvorteile der Datentabelle , während immer noch die Syntax von dplyr verwenden? Mit anderen Worten, verwende ich die Datentabelle falsch, wenn ich sie mit der Dplyr-Syntax abfrage? Oder muss ich eine reine datierbare Syntax verwenden, um die gesamte …
Wie verweisen Sie auf Variablen in a, data.tablewenn die Variablennamen in einem Zeichenvektor gespeichert sind? Dies funktioniert beispielsweise für data.frame: df <- data.frame(col1 = 1:3) colname <- "col1" df[colname] <- 4:6 df # col1 # 1 4 # 2 5 # 3 6 Wie kann ich denselben Vorgang für eine …
data.tableObjekte haben jetzt den Operator: =. Was unterscheidet diesen Operator von allen anderen Zuweisungsoperatoren? Was sind ihre Verwendungszwecke, wie viel schneller ist es und wann sollte es vermieden werden?
Ich habe ein Skript, das Daten aus einer CSV-Datei in eine einliest data.tableund dann den Text in einer Spalte in mehrere neue Spalten aufteilt. Ich benutze derzeit die lapplyund strsplitFunktionen, um dies zu tun. Hier ist ein Beispiel: library("data.table") df = data.table(PREFIX = c("A_B","A_C","A_D","B_A","B_C","B_D"), VALUE = 1:6) dt = as.data.table(df) …
Ich habe eine data.table, mit der ich dieselbe Operation für bestimmte Spalten ausführen möchte. Die Namen dieser Spalten werden in einem Zeichenvektor angegeben. In diesem Beispiel möchte ich alle diese Spalten mit -1 multiplizieren. Einige Spielzeugdaten und ein Vektor, der relevante Spalten angibt: library(data.table) dt <- data.table(a = 1:3, b …
Ich bin gerade dabei, einen dplyr-basierten Workflow auszuprobieren (anstatt hauptsächlich data.table zu verwenden, wie ich es gewohnt bin), und bin auf ein Problem gestoßen, für das ich keine entsprechende dplyr-Lösung finden kann . Ich stoße normalerweise auf das Szenario, in dem ich mehrere Spalten basierend auf einer einzelnen Bedingung bedingt …
Ich möchte eine neue Spalte in einer Datentabelle erstellen, die aus dem aktuellen Wert einer Spalte und dem vorherigen einer anderen berechnet wird. Ist es möglich, auf vorherige Zeilen zuzugreifen? Z.B: > DT <- data.table(A=1:5, B=1:5*10, C=1:5*100) > DT A B C 1: 1 10 100 2: 2 20 200 …
Es gibt viele Beiträge zum Ersetzen von NA-Werten. Mir ist bewusst, dass man NAs in der folgenden Tabelle / im folgenden Frame durch die folgenden ersetzen könnte: x[is.na(x)]<-0 Aber was ist, wenn ich es nur auf bestimmte Spalten beschränken möchte? Lassen Sie mich Ihnen ein Beispiel zeigen. Beginnen wir zunächst …
Ich habe einen großen Datenrahmen (in der Größenordnung von mehreren GB), den ich in einen konvertieren möchte data.table. Mit using as.data.tablewird eine Kopie des Datenrahmens erstellt. Dies bedeutet, dass der verfügbare Speicher mindestens doppelt so groß wie die Daten sein muss. Gibt es eine Möglichkeit, die Konvertierung ohne Kopie durchzuführen? …
Bearbeiten 2019: Diese Frage wurde vor Änderungen im data.tableNovember 2016 gestellt. Die akzeptierte Antwort unten finden Sie sowohl für die aktuelle als auch für die vorherige Methode. Ich habe eine data.tableTabelle mit ungefähr 2,5 Millionen Zeilen. Es gibt zwei Spalten. Ich möchte alle Zeilen entfernen, die in beiden Spalten dupliziert …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.