Angenommen, ich habe einen Datenrahmen mit Ländern, der wie folgt lautet:
cc | temp
US | 37.0
CA | 12.0
US | 35.0
AU | 20.0
Ich weiß, dass es eine pd.get_dummies-Funktion gibt, mit der die Länder in "One-Hot-Codierungen" konvertiert werden können. Ich möchte sie jedoch stattdessen in Indizes umwandeln, sodass ich sie cc_index = [1,2,1,3]
stattdessen erhalte .
Ich gehe davon aus, dass es einen schnelleren Weg gibt als die Verwendung von get_dummies zusammen mit einer numpy where-Klausel, wie unten gezeigt:
[np.where(x) for x in df.cc.get_dummies().values]
Dies ist in R mit 'Faktoren' etwas einfacher, also hoffe ich, dass Pandas etwas Ähnliches haben.
cc_index = [0,1,0,2]
?