Überblick Ich bin relativ vertraut mit data.table, nicht so sehr mit dplyr. Ich habe einige dplyrVignetten und Beispiele gelesen , die auf SO aufgetaucht sind, und bisher sind meine Schlussfolgerungen folgende: data.tableund dplyrsind in der Geschwindigkeit vergleichbar, außer wenn es viele (dh> 10-100K) Gruppen gibt, und unter einigen anderen Umständen …
tibble(zuvor tbl_df) ist eine Version eines Datenrahmens, der vom dplyrDatenrahmen-Manipulationspaket in R erstellt wurde. Sie verhindert lange Tabellenausgaben, wenn der Datenrahmen versehentlich aufgerufen wird. Gibt es nach dem Umschließen eines Datenrahmens mit tibble/ tbl_dfeinen Befehl zum Anzeigen des gesamten Datenrahmens (aller Zeilen und Spalten des Datenrahmens)? Wenn ich verwende df[1:100,], …
Ich muss einen Datenrahmen anhand der Zeile filtern, in der die Zeichenfolge enthalten ist RTB. Ich benutze dplyr. d.del <- df %.% group_by(TrackingPixel) %.% summarise(MonthDelivery = as.integer(sum(Revenue))) %.% arrange(desc(MonthDelivery)) Ich weiß, dass ich die Funktion filterin verwenden kann, dplyraber ich weiß nicht genau, wie ich sie anweisen soll, nach dem …
Kann die Mutation verwendet werden, wenn die Mutation bedingt ist (abhängig von den Werten bestimmter Spaltenwerte)? Dieses Beispiel zeigt, was ich meine. structure(list(a = c(1, 3, 4, 6, 3, 2, 5, 1), b = c(1, 3, 4, 2, 6, 7, 2, 6), c = c(6, 3, 6, 5, 3, 6, …
Gibt es eine prägnantere Möglichkeit, eine Spalte eines dplyr tbl als Vektor aus einem tbl mit Datenbank-Backend zu erhalten (dh der Datenrahmen / die Tabelle kann nicht direkt untergeordnet werden)? require(dplyr) db <- src_sqlite(tempfile(), create = TRUE) iris2 <- copy_to(db, iris) iris2$Species # NULL Das wäre also zu einfach gewesen …
Ich möchte verwenden dplyr::mutate(), um mehrere neue Spalten in einem Datenrahmen zu erstellen. Die Spaltennamen und deren Inhalt sollten dynamisch generiert werden. Beispieldaten von Iris: library(dplyr) iris <- tbl_df(iris) Ich habe eine Funktion erstellt, um meine neuen Spalten aus dem zu mutieren Petal.Width Variablen : multipetal <- function(df, n) { …
Ich habe eine anhaltende mehrfache Warnung vor "unbekannter Spalte" für alle Arten von Befehlen (z. B. str (x) zum Installieren von Updates für Pakete) und bin mir nicht sicher, wie ich dies debuggen oder beheben soll. Die Warnung "unbekannte Spalte" bezieht sich eindeutig auf eine Variable in einem tbl_df, die …
Ich versuche, mein Verständnis von Plyr in Dplyr zu übertragen, kann aber nicht herausfinden, wie ich nach mehreren Spalten gruppieren soll. # make data with weird column names that can't be hard coded data = data.frame( asihckhdoydkhxiydfgfTgdsx = sample(LETTERS[1:3], 100, replace=TRUE), a30mvxigxkghc5cdsvxvyv0ja = sample(LETTERS[1:3], 100, replace=TRUE), value = rnorm(100) ) …
Angenommen, ich möchte den Anteil verschiedener Werte innerhalb jeder Gruppe berechnen. Um zum Beispiel der Verwendung von mtcarsDaten, wie berechne ich die relative Häufigkeit der Anzahl der Gänge von Uhr (automatisch / manuell) in einem Rutsch mit dplyr? library(dplyr) data(mtcars) mtcars <- tbl_df(mtcars) # count frequency mtcars %>% group_by(am, gear) …
Frage Verwendung dplyr, wie wähle ich die obere und untere Beobachtungen / Reihen gruppierten Daten in einer Aussage? Daten & Beispiel Gegeben ein Datenrahmen df <- data.frame(id=c(1,1,1,2,2,2,3,3,3), stopId=c("a","b","c","a","b","c","a","b","c"), stopSequence=c(1,2,3,3,1,4,3,1,2)) Ich kann die oberen und unteren Beobachtungen von jeder Gruppe erhalten slice, indem ich zwei separate Aussagen verwende: firstStop <- df …
Bei der Arbeit mit fand plyrich es oft nützlich, adplyfür Skalarfunktionen zu verwenden, die ich auf jede einzelne Zeile anwenden muss. z.B data(iris) library(plyr) head( adply(iris, 1, transform , Max.Len= max(Sepal.Length,Petal.Length)) ) Sepal.Length Sepal.Width Petal.Length Petal.Width Species Max.Len 1 5.1 3.5 1.4 0.2 setosa 5.1 2 4.9 3.0 1.4 0.2 …
Ich habe die Verwendung von %>%(Prozent größer als Prozent) Funktion in einigen Paketen wie dplyr und rvest gesehen . Was heißt das? Ist es eine Möglichkeit, Abschlussblöcke in R zu schreiben?
Ich mag die Umbenennungsfunktion von Plyr rename. Ich habe vor kurzem angefangen, dplyr zu verwenden, und habe mich gefragt, ob es eine einfache Möglichkeit gibt, Variablen mit einer Funktion von dplyr umzubenennen, die genauso einfach zu verwenden ist wie die von plyr rename?
Mir ist klar, dplyrdass Sie mit Version 3.0 verschiedene Variablen verknüpfen können: left_join(x, y, by = c("a" = "b")passt auf x.azuy.b Ist es jedoch möglich, eine Kombination von Variablen zu verknüpfen, oder muss ich vorher einen zusammengesetzten Schlüssel hinzufügen? Etwas wie das: left_join(x, y, by = c("a c" = "b …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.