Programmierung pandas

4

Auf ein Gruppenobjekt anwenden oder transformieren

Betrachten Sie den folgenden Datenrahmen: A B C D 0 foo one 0.162003 0.087469 1 bar one -1.156319 -1.526272 2 foo two 0.833892 -1.666304 3 bar three -2.026673 -0.322057 4 foo two 0.411452 -0.954371 5 bar two 0.765878 -0.095968 6 foo one -0.654890 0.678091 7 foo three -1.789842 -1.130922 Die …

173 python pandas

5

pandas loc vs. iloc vs. ix vs. at vs. iat?

Vor kurzem begann ich, von meinem sicheren Ort (R) nach Python zu verzweigen, und bin etwas verwirrt über die Lokalisierung / Auswahl der Zellen in Pandas. Ich habe die Dokumentation gelesen, habe jedoch Schwierigkeiten, die praktischen Auswirkungen der verschiedenen Lokalisierungs- / Auswahloptionen zu verstehen. Gibt es einen Grund , warum …

171 python pandas performance indexing lookup

10

So speichern Sie ein Seaborn-Diagramm in einer Datei

Ich habe den folgenden Code ( test_seaborn.py) ausprobiert : import matplotlib matplotlib.use('Agg') import matplotlib.pyplot as plt matplotlib.style.use('ggplot') import seaborn as sns sns.set() df = sns.load_dataset('iris') sns_plot = sns.pairplot(df, hue='species', size=2.5) fig = sns_plot.get_figure() fig.savefig("output.png") #sns.plt.show() Aber ich bekomme diesen Fehler: Traceback (most recent call last): File "test_searborn.py", line 11, in …

171 python pandas matplotlib seaborn

8

So drucken Sie Pandas DataFrame ohne Index

Ich möchte den gesamten Datenrahmen drucken, aber ich möchte nicht den Index drucken Außerdem ist eine Spalte vom Typ Datum / Uhrzeit. Ich möchte nur die Uhrzeit und nicht das Datum drucken. Der Datenrahmen sieht folgendermaßen aus: User ID Enter Time Activity Number 0 123 2014-07-08 00:09:00 1411 1 123 …

169 python datetime pandas dataframe

5

Was ist der Unterschied zwischen einer Pandas-Serie und einem einspaltigen DataFrame?

Warum unterscheiden Pandas zwischen einer Seriesund einer einzelnen Spalte DataFrame? Mit anderen Worten: Was ist der Grund für die Existenz der SeriesKlasse? Ich verwende hauptsächlich Zeitreihen mit Datum / Uhrzeit-Index. Vielleicht hilft das, den Kontext festzulegen.

168 python pandas

7

So filtern Sie Zeilen in Pandas nach Regex

Ich möchte einen Datenrahmen mit Regex in einer der Spalten sauber filtern. Für ein erfundenes Beispiel: In [210]: foo = pd.DataFrame({'a' : [1,2,3,4], 'b' : ['hi', 'foo', 'fat', 'cat']}) In [211]: foo Out[211]: a b 0 1 hi 1 2 foo 2 3 fat 3 4 cat Ich möchte die …

168 python regex pandas

3

Pandas: Zusammenführen (Verbinden) von zwei Datenrahmen in mehreren Spalten

Ich versuche, zwei Pandas-Datenrahmen mit zwei Spalten zu verbinden: new_df = pd.merge(A_df, B_df, how='left', left_on='[A_c1,c2]', right_on = '[B_c1,c2]') habe aber folgenden Fehler bekommen: pandas/index.pyx in pandas.index.IndexEngine.get_loc (pandas/index.c:4164)() pandas/index.pyx in pandas.index.IndexEngine.get_loc (pandas/index.c:4028)() pandas/src/hashtable_class_helper.pxi in pandas.hashtable.PyObjectHashTable.get_item (pandas/hashtable.c:13166)() pandas/src/hashtable_class_helper.pxi in pandas.hashtable.PyObjectHashTable.get_item (pandas/hashtable.c:13120)() KeyError: '[B_1, c2]' Irgendeine Idee, was der richtige Weg sein sollte, …

168 python python-3.x pandas join

7

Konvertieren Sie einen Pandas DataFrame in ein Wörterbuch

Ich habe einen DataFrame mit vier Spalten. Ich möchte diesen DataFrame in ein Python-Wörterbuch konvertieren. Ich möchte, dass die Elemente der ersten Spalte keysund die Elemente anderer Spalten in derselben Zeile sind values. DataFrame: ID A B C 0 p 1 3 2 1 q 4 3 2 2 r …

168 python pandas dictionary dataframe

5

Pandas gruppieren nach Gruppen

Ich möchte meinen Datenrahmen nach zwei Spalten gruppieren und dann die aggregierten Ergebnisse innerhalb der Gruppen sortieren. In [167]: df Out[167]: count job source 0 2 sales A 1 4 sales B 2 6 sales C 3 3 sales D 4 7 sales E 5 5 market A 6 3 …

166 python sorting pandas group-by

6

Pandas DataFrame Gruppieren Sie nach zwei Spalten und erhalten Sie die Anzahl

Ich habe einen Pandas-Datenrahmen im folgenden Format: df = pd.DataFrame([[1.1, 1.1, 1.1, 2.6, 2.5, 3.4,2.6,2.6,3.4,3.4,2.6,1.1,1.1,3.3], list('AAABBBBABCBDDD'), [1.1, 1.7, 2.5, 2.6, 3.3, 3.8,4.0,4.2,4.3,4.5,4.6,4.7,4.7,4.8], ['x/y/z','x/y','x/y/z/n','x/u','x','x/u/v','x/y/z','x','x/u/v/b','-','x/y','x/y/z','x','x/u/v/w'],['1','3','3','2','4','2','5','3','6','3','5','1','1','1']]).T df.columns = ['col1','col2','col3','col4','col5'] df: col1 col2 col3 col4 col5 0 1.1 A 1.1 x/y/z 1 1 1.1 A 1.7 x/y 3 2 1.1 A 2.5 x/y/z/n 3 …

165 python pandas dataframe

4

So fügen Sie einem Pandas DataFrame eine Kopfzeile hinzu

Ich lese eine CSV-Datei in pandas. Diese CSV-Datei besteht aus vier Spalten und einigen Zeilen, hat jedoch keine Kopfzeile, die ich hinzufügen möchte. Ich habe Folgendes versucht: Cov = pd.read_csv("path/to/file.txt", sep='\t') Frame=pd.DataFrame([Cov], columns = ["Sequence", "Start", "End", "Coverage"]) Frame.to_csv("path/to/file.txt", sep='\t') Wenn ich den Code anwende, wird der folgende Fehler angezeigt: …

165 python csv pandas header

5

Anwenden einer Funktion mit mehreren Argumenten zum Erstellen einer neuen Pandas-Spalte

Ich möchte eine neue Spalte in einem pandasDatenrahmen erstellen, indem ich eine Funktion auf zwei vorhandene Spalten anwende. Nach dieser Antwort konnte ich eine neue Spalte erstellen, wenn ich nur eine Spalte als Argument benötige: import pandas as pd df = pd.DataFrame({"A": [10,20,30], "B": [20, 30, 10]}) def fx(x): return …

165 python pandas

4

Pandas DataFrame zur Liste der Wörterbücher

Ich habe den folgenden DataFrame: Kundenartikel1 Artikel2 Artikel3 1 Apfelmilchtomate 2 Wasserorangenkartoffel 3 Saft Mango Chips was ich es in eine Liste von Wörterbüchern pro Zeile übersetzen möchte rows = [{'customer': 1, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'}, {'customer': 2, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'}, {'customer': 3, 'item1': 'juice', …

165 python list dictionary pandas dataframe

7

Verwenden von Pandas zu pd.read_excel () für mehrere Arbeitsblätter derselben Arbeitsmappe

Ich habe eine große Tabellenkalkulationsdatei (.xlsx), die ich mit Python-Pandas verarbeite. Es kommt vor, dass ich Daten von zwei Registerkarten in dieser großen Datei benötige. Eine der Registerkarten enthält eine Menge Daten und die andere enthält nur wenige quadratische Zellen. Wenn ich pd.read_excel () in einem Arbeitsblatt verwende, sieht es …

165 python excel pandas dataframe

8

Nehmen Sie mehrere Listen in den Datenrahmen auf

Wie nehme ich mehrere Listen und füge sie als unterschiedliche Spalten in einen Python-Datenrahmen ein? Ich habe diese Lösung ausprobiert , hatte aber einige Probleme. Versuch 1: Haben Sie drei Listen, komprimieren Sie sie und verwenden Sie diese res = zip(lst1,lst2,lst3) Ergibt nur eine Spalte Versuch 2: percentile_list = pd.DataFrame({'lst1Tite' …

164 python numpy pandas

Als «pandas» getaggte Fragen