Als «pandas» getaggte Fragen

Pandas ist eine Python-Bibliothek zur Datenmanipulation und -analyse, z. B. Datenrahmen, mehrdimensionale Zeitreihen und Querschnittsdatensätze, die häufig in Statistiken, experimentellen wissenschaftlichen Ergebnissen, Ökonometrie oder Finanzen verwendet werden. Pandas ist eine der wichtigsten Data Science-Bibliotheken in Python.

2
Effizient prüfen, ob ein beliebiges Objekt in Python / numpy / pandas NaN ist?
Meine Numpy-Arrays kennzeichnen np.nanfehlende Werte. Während ich den Datensatz durchlaufe, muss ich solche fehlenden Werte erkennen und auf besondere Weise behandeln. Naiv habe ich verwendet numpy.isnan(val), was gut funktioniert, es valsei denn, es gehört nicht zu der Untergruppe der von unterstützten Typen numpy.isnan(). Zum Beispiel können fehlende Daten in Zeichenfolgenfeldern …
101 python  numpy  pandas 

6
Wie wähle ich in Pandas mehrere Datenrahmenspalten aus?
Ich suche nach einer Möglichkeit, das Äquivalent zu SQL zu erreichen SELECT DISTINCT col1, col2 FROM dataframe_table Der Pandas SQL-Vergleich hat nichts zu bieten distinct. .unique() funktioniert nur für eine einzelne Spalte, also könnte ich die Spalten wohl zusammenfassen oder in eine Liste / ein Tupel einfügen und auf diese …
101 python  pandas 

2
Das 'DataFrame'-Objekt hat kein Attribut' sort '.
Ich habe hier ein Problem, in meinem Python-Paket habe ich numpy installiert, aber ich habe immer noch den Fehler 'DataFrame'-Objekt hat kein Attribut' sort ' Jeder kann mir eine Idee geben .. Das ist mein Code: final.loc[-1] =['', 'P','Actual'] final.index = final.index + 1 # shifting index final = final.sort() …

8
Konvertieren Sie kategoriale Daten in Pandas-Datenrahmen
Ich habe einen Datenrahmen mit diesem Datentyp (zu viele Spalten): col1 int64 col2 int64 col3 category col4 category col5 category Spalten scheinen so zu sein: Name: col3, dtype: category Categories (8, object): [B, C, E, G, H, N, S, W] Ich möchte alle Werte in Spalten wie folgt in eine …
101 python  pandas 

7
So löschen Sie die letzte Datenzeile eines Pandas-Datenrahmens
Ich denke, das sollte einfach sein, aber ich habe ein paar Ideen ausprobiert und keine davon hat funktioniert: last_row = len(DF) DF = DF.drop(DF.index[last_row]) #<-- fail! Ich habe versucht, negative Indizes zu verwenden, aber das führte auch zu Fehlern. Ich muss immer noch etwas Grundlegendes falsch verstehen.
101 python  pandas 


12
Löschen Sie Zeilen mit allen Nullen im Pandas-Datenrahmen
Ich kann pandas dropna()Funktionen verwenden, um Zeilen mit einigen oder allen Spalten zu entfernen, die als NA's festgelegt sind. Gibt es eine äquivalente Funktion zum Löschen von Zeilen mit allen Spalten mit dem Wert 0? P kt b tt mky depth 1 0 0 0 0 0 2 0 0 …
101 python  pandas 

7
Zeichnen Sie mit matplotlib verschiedene Farben für verschiedene kategoriale Ebenen
Ich habe diesen Datenrahmen, diamondsder sich aus Variablen wie zusammensetzt (carat, price, color), und ich möchte für jeden ein Streudiagramm von pricebis zeichnen , was bedeutet, dass verschiedene unterschiedliche Farben im Diagramm haben.caratcolorcolor Dies ist leicht in Rmit ggplot: ggplot(aes(x=carat, y=price, color=color), #by setting color=color, ggplot automatically draw in different …


8
Können Pandas ein Histogramm von Daten zeichnen?
Ich habe meine Serie genommen und sie in eine Datums- / Uhrzeitspalte von dtype = gezwungen datetime64[ns](obwohl ich nur eine Tagesauflösung benötige ... nicht sicher, wie ich sie ändern soll). import pandas as pd df = pd.read_csv('somefile.csv') column = df['date'] column = pd.to_datetime(column, coerce=True) aber das Plotten funktioniert nicht: ipdb> …

5
Pandas Spalte nach Ort auswählen
Ich versuche einfach, über eine Ganzzahl auf benannte Pandas-Spalten zuzugreifen. Sie können eine Zeile nach Standort mit auswählen df.ix[3]. Aber wie wählt man eine Spalte nach Ganzzahl aus? Mein Datenrahmen: df=pandas.DataFrame({'a':np.random.rand(5), 'b':np.random.rand(5)})
100 python  pandas  indexing 




7
So verschieben Sie eine Spalte in Pandas DataFrame
Ich möchte eine Spalte in einem Pandas verschieben DataFrame, konnte jedoch aus der Dokumentation keine Methode finden, ohne den gesamten DF neu zu schreiben. Weiß jemand, wie es geht? DataFrame: ## x1 x2 ##0 206 214 ##1 226 234 ##2 245 253 ##3 265 272 ##4 283 291 Gewünschte Ausgabe: …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.