Ich verwende Pandas als Datenbankersatz, da ich mehrere Datenbanken (Oracle, MSSQL usw.) habe und keine Befehlsfolge zu einem SQL-Äquivalent erstellen kann.
Ich habe eine Tabelle in einen DataFrame mit einigen Spalten geladen:
YEARMONTH, CLIENTCODE, SIZE, .... etc etc
In SQL würde die Anzahl der verschiedenen Clients pro Jahr gezählt:
SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;
Und das Ergebnis wäre
201301 5000
201302 13245
Wie kann ich das bei Pandas machen?
value_counts
könnte die Antwort sein, die Sie suchen: pandas.pydata.org/pandas-docs/stable/generated/…