Als «pandas» getaggte Fragen

Pandas ist eine Python-Bibliothek zur Datenmanipulation und -analyse, z. B. Datenrahmen, mehrdimensionale Zeitreihen und Querschnittsdatensätze, die häufig in Statistiken, experimentellen wissenschaftlichen Ergebnissen, Ökonometrie oder Finanzen verwendet werden. Pandas ist eine der wichtigsten Data Science-Bibliotheken in Python.



2
Matplotlib / Pandas-Fehler unter Verwendung des Histogramms
Ich habe ein Problem beim Erstellen von Histogrammen aus Objekten der Pandas-Serie und kann nicht verstehen, warum dies nicht funktioniert. Der Code hat vorher gut funktioniert, aber jetzt nicht mehr. Hier ist ein Teil meines Codes (insbesondere ein Objekt der Pandas-Serie, von dem ich ein Histogramm erstellen möchte): type(dfj2_MARKET1['VSPD2_perc']) welches …

3
Python Pandas zählen und summieren bestimmte Bedingungen
Gibt es in Pandas einzelne Funktionen, um die Äquivalente von SUMIF auszuführen , die über eine bestimmte Bedingung summieren , und COUNTIF , das Werte bestimmter Bedingungen aus Excel zählt? Ich weiß, dass es viele Mehrschrittfunktionen gibt, für die verwendet werden kann zum Beispiel für sumifich kann (df.map(lambda x: condition), …
73 python  pandas  sum 

3
Pandas Datenrahmen read_csv bei fehlerhaften Daten
Ich möchte eine sehr große CSV-Datei einlesen (kann nicht einfach in Excel geöffnet und bearbeitet werden), aber irgendwo in der 100.000sten Zeile gibt es eine Zeile mit einer zusätzlichen Spalte, die zum Absturz des Programms führt. Diese Zeile ist fehlerhaft, daher muss ich die Tatsache ignorieren, dass es sich um …
73 python  csv  pandas 

9
Pandas Datenrahmen Gesamtzeile
Ich habe einen Datenrahmen, so etwas wie: foo bar qux 0 a 1 3.14 1 b 3 2.72 2 c 2 1.62 3 d 9 1.41 4 e 3 0.58 und ich möchte am Ende des Datenrahmens eine 'Gesamt'-Zeile hinzufügen: foo bar qux 0 a 1 3.14 1 b 3 …
73 python  pandas 



2
Löschen Sie mehrere Spalten in Pandas
Ich versuche, mehrere Spalten (Spalte 2 und 70 in meinem Datensatz, indiziert als 1 bzw. 69) nach Indexnummer in einem Pandas-Datenrahmen mit dem folgenden Code zu löschen: df.drop([df.columns[[1, 69]]], axis=1, inplace=True) Ich erhalte folgende Fehlermeldung: TypeError: unhashable type: 'Index' Und in meinem Code wird [1, 69] hervorgehoben und sagt: Expected …
72 python  pandas 

6
Python: Pandas filtern Zeichenfolgendaten basierend auf ihrer Zeichenfolgenlänge
Ich filtere gerne Daten heraus, deren Stringlänge ungleich 10 ist. Wenn ich versuche, eine Zeile herauszufiltern, deren Zeichenfolgenlänge in Spalte A oder B nicht gleich 10 ist, habe ich dies versucht. df=pd.read_csv('filex.csv') df.A=df.A.apply(lambda x: x if len(x)== 10 else np.nan) df.B=df.B.apply(lambda x: x if len(x)== 10 else np.nan) df=df.dropna(subset=['A','B'], how='any') …
72 python  string  pandas  csv  filter 

4
Konvertieren zwischen datetime- und Pandas Timestamp-Objekten
Ich habe folgendes: > date1 Timestamp('2014-01-23 00:00:00', tz=None) > date2 datetime.date(2014, 3, 26) und ich habe diese Antwort gelesen , die ich pandas.to_datetime()zum Konvertieren von Timestampsin datetimeObjekte verwenden könnte, aber es scheint nicht zu funktionieren: > pd.to_datetime(date1) Timestamp('2014-01-23 00:00:00', tz=None) Warum? Wie kann ich zwischen diesen beiden Formaten konvertieren?

3
Seltsamer Fehler in Pandas und Numpy in Bezug auf Multithreading
Die meisten Funktionen des Numpy aktivieren standardmäßig Multithreading. Ich arbeite beispielsweise auf einer Intel-CPU-Workstation mit 8 Kernen, wenn ich ein Skript ausführe import numpy as np x=np.random.random(1000000) for i in range(100000): np.sqrt(x) Das Linux topzeigt 800% CPU-Auslastung während des Betriebs an, was bedeutet, dass numpy automatisch erkennt, dass meine Workstation …
25 python  pandas  numpy 


7
Überprüfen Sie, ob die Pandas-Spalte alle Elemente aus einer Liste enthält
Ich habe einen df wie diesen: frame = pd.DataFrame({'a' : ['a,b,c', 'a,c,f', 'b,d,f','a,z,c']}) Und eine Liste von Gegenständen: letters = ['a','c'] Mein Ziel ist es, alle Zeilen zu erhalten frame, die mindestens die 2 Elemente enthaltenletters Ich habe mir diese Lösung ausgedacht: for i in letters: subframe = frame[frame['a'].str.contains(i)] Dies …
20 python  pandas 

5
Anzahl der Stapel- und Rückgabewerte für jede Variable?
Ich habe einen Datenrahmen, der Antworten von 19717 Personen auf die Wahl der Programmiersprachen durch Multiple-Choice-Fragen aufzeichnet. Die erste Spalte ist natürlich das Geschlecht des Befragten, während der Rest die Auswahl ist, die er ausgewählt hat. Wenn ich also Python auswähle, wird meine Antwort in der Python-Spalte aufgezeichnet und nicht …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.