Wir haben einen Datenrahmen aus einer CSV-Datei. Der Datenrahmen DF
enthält Spalten, die beobachtete Werte enthalten, und eine Spalte ( VaR2
), die das Datum enthält, an dem eine Messung durchgeführt wurde. Wenn das Datum nicht aufgezeichnet wurde, enthält die CSV-Datei den Wert NA
für fehlende Daten.
Var1 Var2
10 2010/01/01
20 NA
30 2010/03/01
Wir möchten den Befehl subset verwenden, um einen neuen Datenrahmen new_DF
so zu definieren, dass er nur Zeilen enthält, die einen NA'
Wert aus der Spalte ( VaR2
) haben. In dem angegebenen Beispiel wird nur Zeile 2 in der neuen enthalten sein DF
.
Der Befehl
new_DF<-subset(DF,DF$Var2=="NA")
funktioniert nicht, der resultierende Datenrahmen hat keine Zeileneinträge.
Wenn in der ursprünglichen CSV-Datei der Wert NA
ausgetauscht wird NULL
, führt derselbe Befehl zum gewünschten Ergebnis : new_DF<-subset(DF,DF$Var2=="NULL")
.
Wie kann ich diese Methode zum Laufen bringen, wenn für die Zeichenfolge der Wert NA
in der ursprünglichen CSV-Datei angegeben ist?