Meine Numpy-Arrays kennzeichnen np.nan
fehlende Werte. Während ich den Datensatz durchlaufe, muss ich solche fehlenden Werte erkennen und auf besondere Weise behandeln.
Naiv habe ich verwendet numpy.isnan(val)
, was gut funktioniert, es val
sei denn, es gehört nicht zu der Untergruppe der von unterstützten Typen numpy.isnan()
. Zum Beispiel können fehlende Daten in Zeichenfolgenfeldern auftreten. In diesem Fall erhalte ich:
>>> np.isnan('some_string')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: Not implemented for this type
Gibt False
es eine Möglichkeit, dies elegant und effizient zu handhaben, außer einen teuren Wrapper zu schreiben, der die Ausnahme abfängt und zurückgibt ?
pandas.isnull()
scheint perfekt zu funktionieren. Der einzige Datentyp, mit dem ich mich derzeit befasse, numpy.isnan()
ist ein String, der gut damit pandas.isnull()
umgeht. Tatsächlich scheint es mit jedem beliebigen Objekt, das ich darauf geworfen habe, gut umzugehen. Gab es spezielle Probleme, über die Sie besorgt waren? Andernfalls möchten Sie Ihren Kommentar möglicherweise als vollständige Antwort einreichen, da dies zumindest für Pandas-Benutzer wie eine kanonische Antwort erscheint.
pandas
hatpandas.isnull()
: Ich bin nicht sicher, ob das Ihren Anforderungen entspricht, daher könnten einige Beispieldaten gut sein.