Die pandas
drop_duplicates
Funktion eignet sich hervorragend zum "Eindeutigen" eines Datenrahmens. Eines der zu übergebenden Schlüsselwortargumente ist jedoch take_last=True
oder take_last=False
, während ich alle Zeilen löschen möchte, die Duplikate in einer Teilmenge von Spalten sind. Ist das möglich?
A B C
0 foo 0 A
1 foo 1 A
2 foo 1 B
3 bar 1 A
Als Beispiel möchte ich Zeilen löschen, die mit Spalten übereinstimmen, A
und C
daher sollten die Zeilen 0 und 1 gelöscht werden.