Programmierung pandas

6

Wie man eine weitere ganze Spalte als Argument an pandas fillna () übergibt

Ich möchte fehlende Werte in einer Spalte mit fillnaMethoden aus einer anderen Spalte füllen . (Ich habe gelesen, dass das Durchlaufen jeder Zeile eine sehr schlechte Übung wäre und dass es besser wäre, alles auf einmal zu machen, aber ich konnte nicht herausfinden, wie ich es machen soll fillna.) Daten …

88 python pandas fillna

2

Lesen von durch Tabulatoren getrennten Dateien mit Pandas - funktioniert unter Windows, jedoch nicht unter Mac

Ich habe eine durch Tabulatoren getrennte Datendatei in Windows mit Pandas / Python ohne Probleme gelesen. Die Datendatei enthält Notizen in den ersten drei Zeilen und folgt mit einer Überschrift. df = pd.read_csv(myfile,sep='\t',skiprows=(0,1,2),header=(0)) Ich versuche jetzt, diese Datei mit meinem Mac zu lesen. (Ich verwende Python zum ersten Mal auf …

88 python macos pandas import tab-delimited

2

float64 mit pandas to_csv

Ich lese eine CSV mit Float-Nummern wie folgt: Bob,0.085 Alice,0.005 Importieren Sie in einen Datenrahmen und schreiben Sie diesen Datenrahmen an einen neuen Ort df = pd.read_csv(orig) df.to_csv(pandasfile) Nun pandasfilehat dies: Bob,0.085000000000000006 Alice,0.0050000000000000001 Was ist los? Vielleicht muss ich auf einen anderen Typ wie float32 oder so umwandeln? Ich benutze …

88 python numpy pandas

5

Wie teile ich eine Tupelspalte im Pandas-Datenrahmen?

Ich habe einen Pandas-Datenrahmen (dies ist nur ein kleines Stück) >>> d1 y norm test y norm train len(y_train) len(y_test) \ 0 64.904368 116.151232 1645 549 1 70.852681 112.639876 1645 549 SVR RBF \ 0 (35.652207342877873, 22.95533537448393) 1 (39.563683797747622, 27.382483096332511) LCV \ 0 (19.365430594452338, 13.880062435173587) 1 (19.099614489458364, 14.018867136617146) RIDGE CV …

88 python numpy pandas dataframe tuples

3

Kommentieren Sie Balken mit Werten in Pandas-Balkendiagrammen

Ich suchte nach einer Möglichkeit, meine Balken in einem Pandas-Balkendiagramm mit den gerundeten numerischen Werten aus meinem DataFrame zu versehen. >>> df=pd.DataFrame({'A':np.random.rand(2),'B':np.random.rand(2)},index=['value1','value2'] ) >>> df A B value1 0.440922 0.911800 value2 0.588242 0.797366 Ich möchte so etwas bekommen: Ich habe es mit diesem Codebeispiel versucht, aber die Anmerkungen sind alle …

88 python matplotlib plot pandas dataframe

3

Konvertieren Sie Zahlenfolgen mit Kommas in Pandas DataFrame in Float

Ich habe einen DataFrame, der Zahlen als Zeichenfolgen mit Kommas für die Tausendermarkierung enthält. Ich muss sie in Schwimmer umwandeln. a = [['1,200', '4,200'], ['7,000', '-0.03'], [ '5', '0']] df=pandas.DataFrame(a) Ich vermute, ich muss locale.atof verwenden. Tatsächlich df[0].apply(locale.atof) funktioniert wie erwartet. Ich bekomme eine Reihe von Schwimmern. Wenn ich es …

88 python pandas

6

Wie füge ich jedem Spaltennamen ein Suffix (oder Präfix) hinzu?

Ich möchte _xjedem Spaltennamen das folgende Suffix hinzufügen : featuresA = myPandasDataFrame.columns.values + '_x' Wie mache ich das? x_Wie würde sich die Lösung ändern , wenn ich als Suffix hinzufügen wollte ?

88 python pandas dataframe

7

Ersetzen weniger Werte in einer Pandas-Datenrahmenspalte durch einen anderen Wert

Ich habe einen Pandas-Datenrahmen df wie unten dargestellt: BrandName Specialty A H B I ABC J D K AB L Ich möchte 'ABC' und 'AB' in der Spalte BrandName durch A ersetzen. Kann mir jemand dabei helfen?

88 python replace pandas dataframe

7

Unterschied (e) zwischen merge () und concat () bei Pandas

Was ist der wesentliche Unterschied zwischen pd.DataFrame.merge()und pd.concat()? Bisher habe ich Folgendes gefunden. Bitte kommentieren Sie, wie vollständig und genau mein Verständnis ist: .merge()kann nur Spalten (plus Zeilenindizes) verwenden und ist semantisch für Operationen im Datenbankstil geeignet. .concat()kann mit beiden Achsen verwendet werden, wobei nur Indizes verwendet werden, und bietet …

88 python pandas join merge concat

1

Pandas-Zeitreihen zeichnen die Haupt- und Neben-Häkchen und Beschriftungen der x-Achse ein

Ich möchte in der Lage sein, die Haupt- und Neben-Xticks und ihre Beschriftungen für ein Zeitreihendiagramm festzulegen, das aus einem Pandas-Zeitreihenobjekt erstellt wurde. Auf der Seite "Was ist neu" von Pandas 0.9 heißt es: "Sie können entweder to_pydatetime verwenden oder einen Konverter für den Zeitstempeltyp registrieren." Aber ich kann nicht …

87 python matplotlib pandas

4

pandas dataframe groupby datetime month

Betrachten Sie eine CSV-Datei: string,date,number a string,2/5/11 9:16am,1.0 a string,3/5/11 10:44pm,2.0 a string,4/22/11 12:07pm,3.0 a string,4/22/11 12:10pm,4.0 a string,4/29/11 11:59am,1.0 a string,5/2/11 1:41pm,2.0 a string,5/2/11 2:02pm,3.0 a string,5/2/11 2:56pm,4.0 a string,5/2/11 3:00pm,5.0 a string,5/2/14 3:02pm,6.0 a string,5/2/14 3:18pm,7.0 Ich kann dies einlesen und die Datumsspalte in das Datum / Uhrzeit-Format …

87 python pandas datetime pandas-groupby

3

Pandas: Wie ändere ich alle Werte einer Spalte?

Ich habe einen Datenrahmen mit einer Spalte namens "Date"und möchte, dass alle Werte aus dieser Spalte denselben Wert haben (nur das Jahr). Beispiel: City Date Paris 01/04/2004 Lisbon 01/09/2004 Madrid 2004 Pekin 31/2004 Was ich will ist: City Date Paris 2004 Lisbon 2004 Madrid 2004 Pekin 2004 Hier ist mein …

87 python database pandas

3

Wie lösche ich eine Spalte, die in Pandas nur Nullen enthält?

Ich habe derzeit einen Datenrahmen, der aus Spalten mit Einsen und Nullen als Werten besteht. Ich möchte die Spalten durchlaufen und diejenigen löschen, die nur aus Nullen bestehen. Folgendes habe ich bisher versucht: ones = [] zeros = [] for year in years: for i in range(0,599): if year[str(i)].values.any() == …

87 python pandas

9

Wie kann man feststellen, ob eine Spalte / Variable in Pandas / NumPy numerisch ist oder nicht?

Gibt es eine bessere Möglichkeit, um festzustellen, ob eine Variable in Pandasund / oder NumPyist numericoder nicht? Ich habe eine selbstdefinierte dictionarymit dtypesals Schlüssel und numeric/ notals Wert.

87 python pandas numpy

1

Wenden Sie die Funktion auf jede Zelle in DataFrame an

Ich habe einen Datenrahmen, der folgendermaßen aussehen könnte: A B C foo bar foo bar bar foo foo bar Ich möchte jedes Element jeder Zeile (oder jedes Element jeder Spalte) durchsehen und die folgende Funktion anwenden, um den nachfolgenden DF zu erhalten: def foo_bar(x): return x.replace('foo', 'wow') A B C …

87 python pandas dataframe apply

Als «pandas» getaggte Fragen