Ich habe einen Datenrahmen mit diesem Datentyp (zu viele Spalten):
col1 int64
col2 int64
col3 category
col4 category
col5 category
Spalten scheinen so zu sein:
Name: col3, dtype: category
Categories (8, object): [B, C, E, G, H, N, S, W]
Ich möchte alle Werte in Spalten wie folgt in eine Ganzzahl konvertieren:
[1, 2, 3, 4, 5, 6, 7, 8]
Ich habe dies für eine Spalte folgendermaßen gelöst:
dataframe['c'] = pandas.Categorical.from_array(dataframe.col3).codes
Jetzt habe ich zwei Spalten in meinem Datenrahmen - alte col3
und neue c
und muss alte Spalten löschen .
Das ist schlechte Praxis. Es funktioniert, aber in meinem Datenrahmen viele Spalten und ich möchte es nicht manuell tun.
Wie macht das pythonisch und nur klug?