Wir haben einen Datenrahmen aus einer CSV-Datei. Der Datenrahmen DFenthält Spalten, die beobachtete Werte enthalten, und eine Spalte ( VaR2), die das Datum enthält, an dem eine Messung durchgeführt wurde. Wenn das Datum nicht aufgezeichnet wurde, enthält die CSV-Datei den Wert NAfür fehlende Daten.
Var1 Var2
10 2010/01/01
20 NA
30 2010/03/01
Wir möchten den Befehl subset verwenden, um einen neuen Datenrahmen new_DFso zu definieren, dass er nur Zeilen enthält, die einen NA'Wert aus der Spalte ( VaR2) haben. In dem angegebenen Beispiel wird nur Zeile 2 in der neuen enthalten sein DF.
Der Befehl
new_DF<-subset(DF,DF$Var2=="NA")
funktioniert nicht, der resultierende Datenrahmen hat keine Zeileneinträge.
Wenn in der ursprünglichen CSV-Datei der Wert NAausgetauscht wird NULL, führt derselbe Befehl zum gewünschten Ergebnis : new_DF<-subset(DF,DF$Var2=="NULL").
Wie kann ich diese Methode zum Laufen bringen, wenn für die Zeichenfolge der Wert NAin der ursprünglichen CSV-Datei angegeben ist?