Als «dplyr» getaggte Fragen

Verwenden Sie dieses Tag für Fragen zu Funktionen aus dem dplyr-Paket, z. B. group_by, zusammenfassen, filtern und auswählen.

5
Sammeln Sie mehrere Sätze von Spalten
Ich habe Daten aus einer Online-Umfrage, bei der die Befragten 1-3 Mal eine Reihe von Fragen durchlaufen. Die Umfrage - Software (Qualtrics) diese Daten in mehreren Spalten-das notiert , ist, F3.2 in der Umfrage werden Spalten haben Q3.2.1., Q3.2.2.und Q3.2.3.: df <- data.frame( id = 1:10, time = as.Date('2009-01-01') + …
107 r  reshape  dplyr  qualtrics  tidyr 

6
Filter für vollständige Fälle in data.frame mit dplyr (fallweises Löschen)
Ist es möglich, einen data.frame mit dplyr nach vollständigen Fällen zu filtern? complete.casesmit einer Liste aller Variablen funktioniert natürlich. Dies ist jedoch a) ausführlich, wenn viele Variablen vorhanden sind, und b) unmöglich, wenn die Variablennamen nicht bekannt sind (z. B. in einer Funktion, die einen data.frame verarbeitet). library(dplyr) df = …
97 r  dplyr  magrittr 

4
dplyr fassen zusammen: Entspricht ".drop = FALSE", um Gruppen mit einer Länge von Null in der Ausgabe beizubehalten
Bei Verwendung summarisemit plyrder ddplyFunktion 'werden leere Kategorien standardmäßig gelöscht. Sie können dieses Verhalten durch Hinzufügen ändern .drop = FALSE. Dies funktioniert jedoch nicht bei Verwendung summarisemit dplyr. Gibt es eine andere Möglichkeit, leere Kategorien im Ergebnis beizubehalten? Hier ist ein Beispiel mit gefälschten Daten. library(dplyr) df = data.frame(a=rep(1:3,4), b=rep(1:2,6)) …
97 r  dplyr  plyr  tidyr 


8
R dplyr: Mehrere Spalten löschen
Ich habe einen Datenrahmen und eine Liste von Spalten in diesem Datenrahmen, die ich löschen möchte. Verwenden wir den irisDatensatz als Beispiel. Ich würde gerne fallen Sepal.Lengthund Sepal.Widthnur die verbleibenden Spalten verwenden. Wie mache ich das mit selectoder select_aus dem dplyrPaket? Folgendes habe ich bisher versucht: drop.cols <- c('Sepal.Length', 'Sepal.Width') …
96 r  dplyr 

5
Summe über mehrere Spalten mit dplyr
Meine Frage besteht darin, Werte über mehrere Spalten eines Datenrahmens zu summieren und eine neue Spalte zu erstellen, die dieser Summierung entspricht dplyr. Die Dateneinträge in den Spalten sind binär (0,1). Ich denke an ein zeilenweises Analogon der summarise_eachoder mutate_eachFunktion von dplyr. Unten finden Sie ein minimales Beispiel für den …
94 r  dplyr 

1
Wie interpretiere ich die dplyr-Nachricht `summate ()`, die die Ausgabe nach 'x' umgruppiert (überschreibe mit dem Argument` .groups`)?
Beim Ausführen von group_by und summary () nach dem Update auf die dplyr-Entwicklungsversion 0.8.99.9003 wurde eine neue Nachricht angezeigt (siehe Beitragstitel). Hier ist ein Beispiel, um die Ausgabe neu zu erstellen: library(tidyverse) library(hablar) df <- read_csv("year, week, rat_house_females, rat_house_males, mouse_wild_females, mouse_wild_males 2018,10,1,1,1,1 2018,10,1,1,1,1 2018,11,2,2,2,2 2018,11,2,2,2,2 2019,10,3,3,3,3 2019,10,3,3,3,3 2019,11,4,4,4,4 2019,11,4,4,4,4") %>% …
94 r  dplyr  summarize 

6
Abrufen der Top-Werte nach Gruppe
Hier ist ein Beispieldatenrahmen: d <- data.frame( x = runif(90), grp = gl(3, 30) ) Ich möchte die Teilmenge dder Zeilen mit den Top 5 Werten von xfür jeden Wert von grp. Mit base-R wäre mein Ansatz ungefähr so: ordered <- d[order(d$x, decreasing = TRUE), ] splits <- split(ordered, ordered$grp) …
91 r  data.table  dplyr 

5
R Bedingte Auswertung bei Verwendung des Rohrbetreibers%>%
Wenn das Rohr Operator %>%mit Paketen wie dplyr, ggvis, dychartsusw., wie soll ich tun bedingt einen Schritt? Beispielsweise; step_1 %>% step_2 %>% if(condition) step_3 Diese Ansätze scheinen nicht zu funktionieren: step_1 %>% step_2 if(condition) %>% step_3 step_1 %>% step_2 %>% if(condition) step_3 Es ist ein langer Weg: if(condition) { step_1 …
90 r  dplyr  ggvis  magrittr 

4
dplyr on data.table, verwende ich data.table wirklich?
Wenn ich dplyr Syntax auf eine Datentabelle , erhalte ich alle die Geschwindigkeitsvorteile der Datentabelle , während immer noch die Syntax von dplyr verwenden? Mit anderen Worten, verwende ich die Datentabelle falsch, wenn ich sie mit der Dplyr-Syntax abfrage? Oder muss ich eine reine datierbare Syntax verwenden, um die gesamte …
89 r  data.table  dplyr 

2
Wie werden die Spaltennamen für x und y beim Beitritt zu dplyr angegeben?
Ich habe zwei Datenrahmen, denen ich mit dplyr beitreten möchte. Einer ist ein Datenrahmen, der Vornamen enthält. test_data <- data.frame(first_name = c("john", "bill", "madison", "abby", "zzz"), stringsAsFactors = FALSE) Der andere Datenrahmen enthält eine bereinigte Version des Kantrowitz-Namenskorpus, die das Geschlecht identifiziert. Hier ist ein minimales Beispiel: kantrowitz <- structure(list(name …
88 r  join  left-join  dplyr 

3
dplyr mutiert mit bedingten Werten
In einem großen Datenrahmen ("myfile") mit vier Spalten muss ich eine fünfte Spalte mit Werten hinzufügen, die bedingt auf den ersten vier Spalten basieren. Bevorzugen Sie Antworten mit dplyrund mutate, hauptsächlich wegen der Geschwindigkeit in großen Datenmengen. Mein Datenrahmen sieht folgendermaßen aus: V1 V2 V3 V4 1 1 2 3 …
88 r  dplyr  mutate 

12
dplyr mutiert / ersetzt mehrere Spalten in einer Teilmenge von Zeilen
Ich bin gerade dabei, einen dplyr-basierten Workflow auszuprobieren (anstatt hauptsächlich data.table zu verwenden, wie ich es gewohnt bin), und bin auf ein Problem gestoßen, für das ich keine entsprechende dplyr-Lösung finden kann . Ich stoße normalerweise auf das Szenario, in dem ich mehrere Spalten basierend auf einer einzelnen Bedingung bedingt …
85 r  data.table  dplyr 

4
Wählen Sie Spalten basierend auf der Zeichenfolgenübereinstimmung aus - dplyr :: select
Ich habe einen Datenrahmen ("Daten") mit vielen, vielen Spalten. Einige der Spalten enthalten eine bestimmte Zeichenfolge ("search_string"). Wie kann ich dplyr::select()eine Teilmenge angeben, die nur die Spalten enthält, die die Zeichenfolge enthalten? Ich habe es versucht: # columns as boolean vector select(data, grepl("search_string",colnames(data))) # columns as vector of column names …
83 r  regex  dplyr 

4
Zählen Sie die Anzahl der Zeilen nach Gruppe mit dplyr
Ich benutze den mtcarsDatensatz. Ich möchte die Anzahl der Datensätze für eine bestimmte Datenkombination ermitteln. Etwas sehr Ähnliches wie die count(*)Group by-Klausel in SQL. ddply()von plyr arbeitet für mich library(plyr) ddply(mtcars, .(cyl,gear),nrow) hat Ausgabe cyl gear V1 1 4 3 1 2 4 4 8 3 4 5 2 4 …
81 r  dplyr  count  plyr 

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.