Ich habe einen Datenrahmen wie diesen:
A B C
0 1 0.749065 This
1 2 0.301084 is
2 3 0.463468 a
3 4 0.643961 random
4 1 0.866521 string
5 2 0.120737 !
Berufung
In [10]: print df.groupby("A")["B"].sum()
wird zurückkehren
A
1 1.615586
2 0.421821
3 0.463468
4 0.643961
Jetzt möchte ich "dasselbe" für Spalte "C" tun. Da diese Spalte Zeichenfolgen enthält, funktioniert sum () nicht (obwohl Sie vielleicht denken, dass es die Zeichenfolgen verketten würde). Was ich wirklich gerne sehen würde, ist eine Liste oder ein Satz von Zeichenfolgen für jede Gruppe, dh
A
1 {This, string}
2 {is, !}
3 {a}
4 {random}
Ich habe versucht, Wege zu finden, dies zu tun.
Series.unique () ( http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.unique.html ) funktioniert jedoch nicht
df.groupby("A")["B"]
ist ein
pandas.core.groupby.SeriesGroupBy object
Ich hatte gehofft, dass jede Serienmethode funktionieren würde. Irgendwelche Ideen?
apply
undlambda
s beseitigt wird . Ich bin hierher gekommen und habe mich gefragt, warumpandas
eigentlich Concats und kein Fehler beim Summieren von Strings zurückgegeben werden.