Ich muss eine Spalte, die Informationen enthält, in mehrere Spalten aufteilen.
Ich würde verwenden, tstrsplit
aber die gleiche Art von Informationen ist nicht in der gleichen Reihenfolge zwischen den Zeilen und ich muss den Namen der neuen Spalte innerhalb der Variablen extrahieren. Wichtig zu wissen: Es kann viele Informationen geben (Felder, die zu neuen Variablen werden), und ich kenne nicht alle, daher möchte ich keine "Feld für Feld" -Lösung.
Unten ist ein Beispiel für das, was ich habe:
library(data.table)
myDT <- structure(list(chr = c("chr1", "chr2", "chr4"), pos = c(123L,
435L, 120L), info = c("type=3;end=4", "end=6", "end=5;pos=TRUE;type=2"
)), class = c("data.table", "data.frame"), row.names = c(NA,-3L))
# chr pos info
#1: chr1 123 type=3;end=4
#2: chr2 435 end=6
#3: chr4 120 end=5;pos=TRUE;type=2
Und ich würde gerne bekommen:
# chr pos end pos type
#1: chr1 123 4 <NA> 3
#2: chr2 435 6 <NA> <NA>
#3: chr4 120 5 TRUE 2
Ein sehr einfacher Weg, dies zu erreichen, wäre sehr dankbar! ( Hinweis: Ich bin nicht bereit, einen dplyr / tidyr-Weg einzuschlagen. )