Programmierung dplyr

4

Fehler: Funktion "%>%" konnte nicht gefunden werden

Ich führe ein Beispiel in R aus, gehe die Schritte durch und alles funktioniert bis jetzt, außer dass dieser Code einen Fehler erzeugt: words <- dtm %>% as.matrix %>% colnames %>% (function(x) x[nchar(x) < 20]) Fehler: Funktion "%>%" konnte nicht gefunden werden Ich verstehe nicht, welchen Nutzen die Verwendung dieses …

79 r dplyr magrittr

7

dplyr filter: Ruft Zeilen mit einem Minimum an Variablen ab, aber nur die ersten, wenn mehrere Minima vorhanden sind

Ich möchte einen gruppierten Filter so erstellen dplyr, dass innerhalb jeder Gruppe nur die Zeile zurückgegeben wird, die den Mindestwert der Variablen hat x. Mein Problem ist: Wie erwartet werden bei mehreren Minima alle Zeilen mit dem Mindestwert zurückgegeben. In meinem Fall möchte ich die erste Zeile jedoch nur, wenn …

73 r dplyr

6

Extrahieren Sie die Zeile, die dem Mindestwert einer Variablen entspricht, nach Gruppe

Ich möchte (1) Daten nach einer Variablen gruppieren ( State), (2) innerhalb jeder Gruppe die Zeile mit dem Mindestwert einer anderen Variablen finden ( Employees) und (3) die gesamte Zeile extrahieren. (1) und (2) sind einfache Einzeiler, und ich denke, (3) sollte es auch sein, aber ich kann es nicht …

73 r dplyr data.table aggregate

3

Verwenden Sie%>% mit Ersatzfunktionen wie colnames () <-

Wie kann ich den Pipe Operator verwenden, um in die Ersatzfunktion zu leiten colnames()<-? Folgendes versuche ich zu tun: library(dplyr) averages_df <- group_by(mtcars, cyl) %>% summarise(mean(disp), mean(hp)) colnames(averages_df) <- c("cyl", "disp_mean", "hp_mean") averages_df # Source: local data frame [3 x 3] # # cyl disp_mean hp_mean # 1 4 105.1364 …

73 r dplyr magrittr

4

Filtern Sie mehrere Werte in einer Zeichenfolgenspalte in dplyr

Ich habe eine data.framemit Zeichendaten in einer der Spalten. Ich möchte mehrere Optionen in data.framederselben Spalte filtern . Gibt es eine einfache Möglichkeit, dies zu tun, die mir fehlt? Beispiel: data.frame name =dat days name 88 Lynn 11 Tom 2 Chris 5 Lisa 22 Kyla 1 Tom 222 Lynn 2 …

72 r dplyr string-matching multiple-conditions

7

So ersetzen Sie NA durch eine Reihe von Werten

Ich habe folgenden Datenrahmen: library(dplyr) library(tibble) df <- tibble( source = c("a", "b", "c", "d", "e"), score = c(10, 5, NA, 3, NA ) ) df Es sieht aus wie das: # A tibble: 5 x 2 source score <chr> <dbl> 1 a 10 . # current max value 2 …

18 r dplyr tibble

3

Verwendung einer auf Tidyeval basierenden nicht standardmäßigen Bewertung bei der Rekodierung auf der rechten Seite des Mutats

Stellen Sie sich ein Tibble vor, bei dem jede Spalte ein Zeichenvektor ist, der viele Werte annehmen kann - sagen wir "A" bis "F". library(tidyverse) sample_df <- tibble(q1 = c("A", "B", "C"), q2 = c("B", "B", "A")) Ich möchte eine Funktion erstellen, die einen Spaltennamen als Argument verwendet und diese …

13 r dplyr rlang tidyeval nse

1

So schwenken Sie den Datenrahmen, der aus einer Spalte mit Abschnitt und Unterabschnitt besteht. In R.

Ich habe einen unten genannten Datenrahmen: structure( list(ID = c("P-1", " P-1", "P-1", "P-2", "P-3", "P-4", "P-5", "P-6", "P-7", "P-8"), Date = c("2020-03-16 12:11:33", "2020-03-16 13:16:04", "2020-03-16 06:13:55", "2020-03-16 10:03:43", "2020-03-16 12:37:09", "2020-03-16 06:40:24", "2020-03-16 09:46:45", "2020-03-16 12:07:44", "2020-03-16 14:09:51", "2020-03-16 09:19:23"), Status = c("SA", "SA", "SA", "RE", "RE", "RE", …

12 r dataframe dplyr tidyverse tidyr

1

Dynamisches Mutieren mehrerer Spalten beim Konditionieren bestimmter Zeilen

Ich weiß, dass es hier einige ähnliche Fragen gibt, aber keine scheint das genaue Problem anzusprechen, das ich habe. set.seed(4) df = data.frame( Key = c("A", "B", "A", "D", "A"), Val1 = rnorm(5), Val2 = runif(5), Val3 = 1:5 ) Ich möchte die Werte der Wertespalten für die Zeilen auf …

11 r dplyr data.table

2

dplyr-Filterbedingung zur Unterscheidung zwischen dem Unicode-Symbol und seiner Unicode-Darstellung

Ich versuche, die Symbolspalte danach zu filtern, ob sie vom Formular ist \uxxxx Dies ist leicht visuell, das heißt, einige sehen aus wie $, ¢, £, und andere wie \u058f, \u060b, \u07fe. Aber ich kann es nicht mit stringi/ herausfindendplyr library(dplyr) library(stringi) df <- structure(list(Character = c("\\u0024", "\\u00A2", "\\u00A3", "\\u00A4", …

10 r dplyr stringr stringi

3

Was kann ich mit dtplyr nicht machen, was ich in data.table kann?

Soll ich meinen Lernaufwand für die Daten Gerangel in R, und zwar zwischen investieren dplyr, dtplyrund data.table? Ich benutze dplyrmeistens, aber wenn die Daten dafür zu groß sind, werde ich sie verwenden data.table, was selten vorkommt. Nun, da dtplyrv1.0 als Schnittstelle für herauskommt data.table, scheint es, als müsste ich mir …

9 r dplyr data.table dtplyr

5

Erstellen einer neuen Spalte unter bestimmten Bedingungen basierend auf den vorherigen n Zeilen

Ich habe einen Datenrahmen wie folgt eingerichtet: df <- data.frame("id" = c(111,111,111,222,222,222,222,333,333,333,333), "Location" = c("A","B","A","A","C","B","A","B","A","A","A"), "Encounter" = c(1,2,3,1,2,3,4,1,2,3,4)) id Location Encounter 1 111 A 1 2 111 B 2 3 111 A 3 4 222 A 1 5 222 C 2 6 222 B 3 7 222 A 4 8 …

9 r dataframe dplyr duplicates

4

Effiziente Methode zum Löschen von Zeilen mit überlappenden Zeiten

Ich habe einen langen Datensatz mit Spalten, die Start- und Stoppzeiten darstellen, und ich möchte eine Zeile löschen, wenn sie sich mit einer anderen überschneidet und eine höhere Priorität hat (z. B. 1 ist die höchste Priorität). Meine Beispieldaten sind library(tidyverse) library(lubridate) times_df <- tibble(start = as_datetime(c("2019-10-05 14:05:25", "2019-10-05 17:30:20", …

9 r dplyr

5

Wie wähle ich zwischen 3 Werten aus, wobei die 2 in R am nächsten beieinander liegen?

Ich möchte für jeden auswählen ID die beiden nächsten Werte vonCq . Ich dachte, ich hätte es herausgefunden, aber es hängt von der Reihenposition ab ... Hier ist ein Beispiel für die Form meines Datensatzes: df <- data.frame(ID = c("A","A","A","B","B","B","C","C","C"), Cq = c(34.32,34.40,34.31,31.49,31.40,31.49,31.22,31.31,31.08)) ID Cq 1 A 34.32 2 A …

8 r dplyr

Als «dplyr» getaggte Fragen