Wie wähle ich Zeilen mit NaN in einer bestimmten Spalte aus?


96

Wie kann man angesichts dieses Datenrahmens nur die Zeilen auswählen, deren "Col2" gleich ist NaN?

In [56]: df = pd.DataFrame([range(3), [0, np.NaN, 0], [0, 0, np.NaN], range(3), range(3)], columns=["Col1", "Col2", "Col3"])

In [57]: df
Out[57]: 
   0   1   2
0  0   1   2
1  0 NaN   0
2  0   0 NaN
3  0   1   2
4  0   1   2

Das Ergebnis sollte folgendes sein:

Out[57]: 
   0   1   2
1  0 NaN   0

Antworten:


170

Versuche Folgendes:

df[df['Col2'].isnull()]

9
Alternativ, df.loc[df['Col2'].isnull()]wenn .loc Ihre Art von Sache ist
Alexander

1
F: Wie negiere ich das, dh wo Daten in Spalte "nicht null sind"? A: mit dem .notnull()Operator.
Sk

9

@qbzenker lieferte die idiomatischste Methode IMO

Hier einige Alternativen:

In [28]: df.query('Col2 != Col2') # Using the fact that: np.nan != np.nan
Out[28]:
   Col1  Col2  Col3
1     0   NaN   0.0

In [29]: df[np.isnan(df.Col2)]
Out[29]:
   Col1  Col2  Col3
1     0   NaN   0.0
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.