Als «dplyr» getaggte Fragen

Verwenden Sie dieses Tag für Fragen zu Funktionen aus dem dplyr-Paket, z. B. group_by, zusammenfassen, filtern und auswählen.

4
Fehler: Funktion "%>%" konnte nicht gefunden werden
Ich führe ein Beispiel in R aus, gehe die Schritte durch und alles funktioniert bis jetzt, außer dass dieser Code einen Fehler erzeugt: words <- dtm %>% as.matrix %>% colnames %>% (function(x) x[nchar(x) < 20]) Fehler: Funktion "%>%" konnte nicht gefunden werden Ich verstehe nicht, welchen Nutzen die Verwendung dieses …
79 r  dplyr  magrittr 



3
Verwenden Sie%>% mit Ersatzfunktionen wie colnames () <-
Wie kann ich den Pipe Operator verwenden, um in die Ersatzfunktion zu leiten colnames()&lt;-? Folgendes versuche ich zu tun: library(dplyr) averages_df &lt;- group_by(mtcars, cyl) %&gt;% summarise(mean(disp), mean(hp)) colnames(averages_df) &lt;- c("cyl", "disp_mean", "hp_mean") averages_df # Source: local data frame [3 x 3] # # cyl disp_mean hp_mean # 1 4 105.1364 …
73 r  dplyr  magrittr 


7
So ersetzen Sie NA durch eine Reihe von Werten
Ich habe folgenden Datenrahmen: library(dplyr) library(tibble) df &lt;- tibble( source = c("a", "b", "c", "d", "e"), score = c(10, 5, NA, 3, NA ) ) df Es sieht aus wie das: # A tibble: 5 x 2 source score &lt;chr&gt; &lt;dbl&gt; 1 a 10 . # current max value 2 …
18 r  dplyr  tibble 


1
So schwenken Sie den Datenrahmen, der aus einer Spalte mit Abschnitt und Unterabschnitt besteht. In R.
Ich habe einen unten genannten Datenrahmen: structure( list(ID = c("P-1", " P-1", "P-1", "P-2", "P-3", "P-4", "P-5", "P-6", "P-7", "P-8"), Date = c("2020-03-16 12:11:33", "2020-03-16 13:16:04", "2020-03-16 06:13:55", "2020-03-16 10:03:43", "2020-03-16 12:37:09", "2020-03-16 06:40:24", "2020-03-16 09:46:45", "2020-03-16 12:07:44", "2020-03-16 14:09:51", "2020-03-16 09:19:23"), Status = c("SA", "SA", "SA", "RE", "RE", "RE", …



3
Was kann ich mit dtplyr nicht machen, was ich in data.table kann?
Soll ich meinen Lernaufwand für die Daten Gerangel in R, und zwar zwischen investieren dplyr, dtplyrund data.table? Ich benutze dplyrmeistens, aber wenn die Daten dafür zu groß sind, werde ich sie verwenden data.table, was selten vorkommt. Nun, da dtplyrv1.0 als Schnittstelle für herauskommt data.table, scheint es, als müsste ich mir …
9 r  dplyr  data.table  dtplyr 


4
Effiziente Methode zum Löschen von Zeilen mit überlappenden Zeiten
Ich habe einen langen Datensatz mit Spalten, die Start- und Stoppzeiten darstellen, und ich möchte eine Zeile löschen, wenn sie sich mit einer anderen überschneidet und eine höhere Priorität hat (z. B. 1 ist die höchste Priorität). Meine Beispieldaten sind library(tidyverse) library(lubridate) times_df &lt;- tibble(start = as_datetime(c("2019-10-05 14:05:25", "2019-10-05 17:30:20", …
9 r  dplyr 

5
Wie wähle ich zwischen 3 Werten aus, wobei die 2 in R am nächsten beieinander liegen?
Ich möchte für jeden auswählen ID die beiden nächsten Werte vonCq . Ich dachte, ich hätte es herausgefunden, aber es hängt von der Reihenposition ab ... Hier ist ein Beispiel für die Form meines Datensatzes: df &lt;- data.frame(ID = c("A","A","A","B","B","B","C","C","C"), Cq = c(34.32,34.40,34.31,31.49,31.40,31.49,31.22,31.31,31.08)) ID Cq 1 A 34.32 2 A …
8 r  dplyr 
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.