Als «pandas» getaggte Fragen

Pandas ist eine Python-Bibliothek zur Datenmanipulation und -analyse, z. B. Datenrahmen, mehrdimensionale Zeitreihen und Querschnittsdatensätze, die häufig in Statistiken, experimentellen wissenschaftlichen Ergebnissen, Ökonometrie oder Finanzen verwendet werden. Pandas ist eine der wichtigsten Data Science-Bibliotheken in Python.


2
Lesen von durch Tabulatoren getrennten Dateien mit Pandas - funktioniert unter Windows, jedoch nicht unter Mac
Ich habe eine durch Tabulatoren getrennte Datendatei in Windows mit Pandas / Python ohne Probleme gelesen. Die Datendatei enthält Notizen in den ersten drei Zeilen und folgt mit einer Überschrift. df = pd.read_csv(myfile,sep='\t',skiprows=(0,1,2),header=(0)) Ich versuche jetzt, diese Datei mit meinem Mac zu lesen. (Ich verwende Python zum ersten Mal auf …

2
float64 mit pandas to_csv
Ich lese eine CSV mit Float-Nummern wie folgt: Bob,0.085 Alice,0.005 Importieren Sie in einen Datenrahmen und schreiben Sie diesen Datenrahmen an einen neuen Ort df = pd.read_csv(orig) df.to_csv(pandasfile) Nun pandasfilehat dies: Bob,0.085000000000000006 Alice,0.0050000000000000001 Was ist los? Vielleicht muss ich auf einen anderen Typ wie float32 oder so umwandeln? Ich benutze …
88 python  numpy  pandas 

5
Wie teile ich eine Tupelspalte im Pandas-Datenrahmen?
Ich habe einen Pandas-Datenrahmen (dies ist nur ein kleines Stück) >>> d1 y norm test y norm train len(y_train) len(y_test) \ 0 64.904368 116.151232 1645 549 1 70.852681 112.639876 1645 549 SVR RBF \ 0 (35.652207342877873, 22.95533537448393) 1 (39.563683797747622, 27.382483096332511) LCV \ 0 (19.365430594452338, 13.880062435173587) 1 (19.099614489458364, 14.018867136617146) RIDGE CV …

3
Kommentieren Sie Balken mit Werten in Pandas-Balkendiagrammen
Ich suchte nach einer Möglichkeit, meine Balken in einem Pandas-Balkendiagramm mit den gerundeten numerischen Werten aus meinem DataFrame zu versehen. >>> df=pd.DataFrame({'A':np.random.rand(2),'B':np.random.rand(2)},index=['value1','value2'] ) >>> df A B value1 0.440922 0.911800 value2 0.588242 0.797366 Ich möchte so etwas bekommen: Ich habe es mit diesem Codebeispiel versucht, aber die Anmerkungen sind alle …

3
Konvertieren Sie Zahlenfolgen mit Kommas in Pandas DataFrame in Float
Ich habe einen DataFrame, der Zahlen als Zeichenfolgen mit Kommas für die Tausendermarkierung enthält. Ich muss sie in Schwimmer umwandeln. a = [['1,200', '4,200'], ['7,000', '-0.03'], [ '5', '0']] df=pandas.DataFrame(a) Ich vermute, ich muss locale.atof verwenden. Tatsächlich df[0].apply(locale.atof) funktioniert wie erwartet. Ich bekomme eine Reihe von Schwimmern. Wenn ich es …
88 python  pandas 



7
Unterschied (e) zwischen merge () und concat () bei Pandas
Was ist der wesentliche Unterschied zwischen pd.DataFrame.merge()und pd.concat()? Bisher habe ich Folgendes gefunden. Bitte kommentieren Sie, wie vollständig und genau mein Verständnis ist: .merge()kann nur Spalten (plus Zeilenindizes) verwenden und ist semantisch für Operationen im Datenbankstil geeignet. .concat()kann mit beiden Achsen verwendet werden, wobei nur Indizes verwendet werden, und bietet …
88 python  pandas  join  merge  concat 


4
pandas dataframe groupby datetime month
Betrachten Sie eine CSV-Datei: string,date,number a string,2/5/11 9:16am,1.0 a string,3/5/11 10:44pm,2.0 a string,4/22/11 12:07pm,3.0 a string,4/22/11 12:10pm,4.0 a string,4/29/11 11:59am,1.0 a string,5/2/11 1:41pm,2.0 a string,5/2/11 2:02pm,3.0 a string,5/2/11 2:56pm,4.0 a string,5/2/11 3:00pm,5.0 a string,5/2/14 3:02pm,6.0 a string,5/2/14 3:18pm,7.0 Ich kann dies einlesen und die Datumsspalte in das Datum / Uhrzeit-Format …

3
Pandas: Wie ändere ich alle Werte einer Spalte?
Ich habe einen Datenrahmen mit einer Spalte namens "Date"und möchte, dass alle Werte aus dieser Spalte denselben Wert haben (nur das Jahr). Beispiel: City Date Paris 01/04/2004 Lisbon 01/09/2004 Madrid 2004 Pekin 31/2004 Was ich will ist: City Date Paris 2004 Lisbon 2004 Madrid 2004 Pekin 2004 Hier ist mein …

3
Wie lösche ich eine Spalte, die in Pandas nur Nullen enthält?
Ich habe derzeit einen Datenrahmen, der aus Spalten mit Einsen und Nullen als Werten besteht. Ich möchte die Spalten durchlaufen und diejenigen löschen, die nur aus Nullen bestehen. Folgendes habe ich bisher versucht: ones = [] zeros = [] for year in years: for i in range(0,599): if year[str(i)].values.any() == …
87 python  pandas 


1
Wenden Sie die Funktion auf jede Zelle in DataFrame an
Ich habe einen Datenrahmen, der folgendermaßen aussehen könnte: A B C foo bar foo bar bar foo foo bar Ich möchte jedes Element jeder Zeile (oder jedes Element jeder Spalte) durchsehen und die folgende Funktion anwenden, um den nachfolgenden DF zu erhalten: def foo_bar(x): return x.replace('foo', 'wow') A B C …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.