Wie greife ich mit dem Schlüssel auf den entsprechenden groupby-Datenrahmen in einem groupby-Objekt zu?
Mit folgender Gruppe:
rand = np.random.RandomState(1)
df = pd.DataFrame({'A': ['foo', 'bar'] * 3,
'B': rand.randn(6),
'C': rand.randint(0, 20, 6)})
gb = df.groupby(['A'])
Ich kann es durchlaufen, um die Schlüssel und Gruppen zu erhalten:
In [11]: for k, gp in gb:
print 'key=' + str(k)
print gp
key=bar
A B C
1 bar -0.611756 18
3 bar -1.072969 10
5 bar -2.301539 18
key=foo
A B C
0 foo 1.624345 5
2 foo -0.528172 11
4 foo 0.865408 14
Ich möchte über ihren Schlüssel auf eine Gruppe zugreifen können:
In [12]: gb['foo']
Out[12]:
A B C
0 foo 1.624345 5
2 foo -0.528172 11
4 foo 0.865408 14
Aber wenn ich das mit versuche, gb[('foo',)]
bekomme ich dieses seltsame pandas.core.groupby.DataFrameGroupBy
Objekt, das keine Methoden zu haben scheint, die dem gewünschten DataFrame entsprechen.
Das Beste, was ich mir vorstellen kann, ist:
In [13]: def gb_df_key(gb, key, orig_df):
ix = gb.indices[key]
return orig_df.ix[ix]
gb_df_key(gb, 'foo', df)
Out[13]:
A B C
0 foo 1.624345 5
2 foo -0.528172 11
4 foo 0.865408 14
Aber das ist irgendwie böse, wenn man bedenkt, wie nett Pandas normalerweise in diesen Dingen sind.
Was ist die eingebaute Methode, um dies zu tun?
groups = dict(list(gb))
nur eine Spalte gespeichert wirdC
? Angenommen, ich interessiere mich nicht für die anderen Spalten und möchte sie daher nicht speichern.