Ich suche nach einer Möglichkeit, das Äquivalent zu SQL zu erreichen
SELECT DISTINCT col1, col2 FROM dataframe_table
Der Pandas SQL-Vergleich hat nichts zu bieten distinct
.
.unique()
funktioniert nur für eine einzelne Spalte, also könnte ich die Spalten wohl zusammenfassen oder in eine Liste / ein Tupel einfügen und auf diese Weise vergleichen, aber dies scheint etwas zu sein, das Pandas auf eine native Art und Weise tun sollten.
Vermisse ich etwas Offensichtliches oder gibt es keine Möglichkeit, dies zu tun?
df.apply(pd.Series.unique)
aber dies funktioniert nicht, wenn die Anzahl der eindeutigen Werte in den Spalten variiert, sodass Sie ein Diktat der Spaltennamen als Schlüssel und der eindeutigen Werte als Werte