Sie können diese Art von Teilmenge nicht mit machen $
. Im Quellcode ( R/src/main/subset.c
) heißt es:
/ * Der Operator $ subset.
Wir müssen sicher sein, nur das erste Argument zu bewerten.
Das zweite Symbol ist ein Symbol, das abgeglichen und nicht ausgewertet werden muss.
* /
Zweites Argument? Was?! Sie müssen erkennen , dass $
, wie alles andere in R (einschließlich zum Beispiel (
, +
, ^
etc) ist eine Funktion, die ausgewertet Argumente und nimmt. df$V1
könnte umgeschrieben werden als
`$`(df , V1)
oder in der Tat
`$`(df , "V1")
Aber...
`$`(df , paste0("V1") )
... zum Beispiel wird niemals funktionieren, noch wird irgendetwas anderes, das zuerst im zweiten Argument bewertet werden muss. Sie dürfen nur eine Zeichenfolge übergeben, die niemals ausgewertet wird.
Verwenden Sie stattdessen [
(oder [[
wenn Sie nur eine einzelne Spalte als Vektor extrahieren möchten).
Beispielsweise,
var <- "mpg"
#Doesn't work
mtcars$var
#These both work, but note that what they return is different
# the first is a vector, the second is a data.frame
mtcars[[var]]
mtcars[var]
Sie können die Bestellung ohne Schleifen ausführen, indem Sie do.call
den Aufruf an erstellen order
. Hier ist ein reproduzierbares Beispiel unten:
# set seed for reproducibility
set.seed(123)
df <- data.frame( col1 = sample(5,10,repl=T) , col2 = sample(5,10,repl=T) , col3 = sample(5,10,repl=T) )
# We want to sort by 'col3' then by 'col1'
sort_list <- c("col3","col1")
# Use 'do.call' to call order. Seccond argument in do.call is a list of arguments
# to pass to the first argument, in this case 'order'.
# Since a data.frame is really a list, we just subset the data.frame
# according to the columns we want to sort in, in that order
df[ do.call( order , df[ , match( sort_list , names(df) ) ] ) , ]
col1 col2 col3
10 3 5 1
9 3 2 2
7 3 2 3
8 5 1 3
6 1 5 4
3 3 4 4
2 4 3 4
5 5 1 4
1 2 5 5
4 5 3 5