Als «pandas» getaggte Fragen

Pandas ist eine Python-Bibliothek zur Datenmanipulation und -analyse, z. B. Datenrahmen, mehrdimensionale Zeitreihen und Querschnittsdatensätze, die häufig in Statistiken, experimentellen wissenschaftlichen Ergebnissen, Ökonometrie oder Finanzen verwendet werden. Pandas ist eine der wichtigsten Data Science-Bibliotheken in Python.

4
Auf ein Gruppenobjekt anwenden oder transformieren
Betrachten Sie den folgenden Datenrahmen: A B C D 0 foo one 0.162003 0.087469 1 bar one -1.156319 -1.526272 2 foo two 0.833892 -1.666304 3 bar three -2.026673 -0.322057 4 foo two 0.411452 -0.954371 5 bar two 0.765878 -0.095968 6 foo one -0.654890 0.678091 7 foo three -1.789842 -1.130922 Die …
173 python  pandas 

5
pandas loc vs. iloc vs. ix vs. at vs. iat?
Vor kurzem begann ich, von meinem sicheren Ort (R) nach Python zu verzweigen, und bin etwas verwirrt über die Lokalisierung / Auswahl der Zellen in Pandas. Ich habe die Dokumentation gelesen, habe jedoch Schwierigkeiten, die praktischen Auswirkungen der verschiedenen Lokalisierungs- / Auswahloptionen zu verstehen. Gibt es einen Grund , warum …

10
So speichern Sie ein Seaborn-Diagramm in einer Datei
Ich habe den folgenden Code ( test_seaborn.py) ausprobiert : import matplotlib matplotlib.use('Agg') import matplotlib.pyplot as plt matplotlib.style.use('ggplot') import seaborn as sns sns.set() df = sns.load_dataset('iris') sns_plot = sns.pairplot(df, hue='species', size=2.5) fig = sns_plot.get_figure() fig.savefig("output.png") #sns.plt.show() Aber ich bekomme diesen Fehler: Traceback (most recent call last): File "test_searborn.py", line 11, in …

8
So drucken Sie Pandas DataFrame ohne Index
Ich möchte den gesamten Datenrahmen drucken, aber ich möchte nicht den Index drucken Außerdem ist eine Spalte vom Typ Datum / Uhrzeit. Ich möchte nur die Uhrzeit und nicht das Datum drucken. Der Datenrahmen sieht folgendermaßen aus: User ID Enter Time Activity Number 0 123 2014-07-08 00:09:00 1411 1 123 …


7
So filtern Sie Zeilen in Pandas nach Regex
Ich möchte einen Datenrahmen mit Regex in einer der Spalten sauber filtern. Für ein erfundenes Beispiel: In [210]: foo = pd.DataFrame({'a' : [1,2,3,4], 'b' : ['hi', 'foo', 'fat', 'cat']}) In [211]: foo Out[211]: a b 0 1 hi 1 2 foo 2 3 fat 3 4 cat Ich möchte die …
168 python  regex  pandas 

3
Pandas: Zusammenführen (Verbinden) von zwei Datenrahmen in mehreren Spalten
Ich versuche, zwei Pandas-Datenrahmen mit zwei Spalten zu verbinden: new_df = pd.merge(A_df, B_df, how='left', left_on='[A_c1,c2]', right_on = '[B_c1,c2]') habe aber folgenden Fehler bekommen: pandas/index.pyx in pandas.index.IndexEngine.get_loc (pandas/index.c:4164)() pandas/index.pyx in pandas.index.IndexEngine.get_loc (pandas/index.c:4028)() pandas/src/hashtable_class_helper.pxi in pandas.hashtable.PyObjectHashTable.get_item (pandas/hashtable.c:13166)() pandas/src/hashtable_class_helper.pxi in pandas.hashtable.PyObjectHashTable.get_item (pandas/hashtable.c:13120)() KeyError: '[B_1, c2]' Irgendeine Idee, was der richtige Weg sein sollte, …


5
Pandas gruppieren nach Gruppen
Ich möchte meinen Datenrahmen nach zwei Spalten gruppieren und dann die aggregierten Ergebnisse innerhalb der Gruppen sortieren. In [167]: df Out[167]: count job source 0 2 sales A 1 4 sales B 2 6 sales C 3 3 sales D 4 7 sales E 5 5 market A 6 3 …

6
Pandas DataFrame Gruppieren Sie nach zwei Spalten und erhalten Sie die Anzahl
Ich habe einen Pandas-Datenrahmen im folgenden Format: df = pd.DataFrame([[1.1, 1.1, 1.1, 2.6, 2.5, 3.4,2.6,2.6,3.4,3.4,2.6,1.1,1.1,3.3], list('AAABBBBABCBDDD'), [1.1, 1.7, 2.5, 2.6, 3.3, 3.8,4.0,4.2,4.3,4.5,4.6,4.7,4.7,4.8], ['x/y/z','x/y','x/y/z/n','x/u','x','x/u/v','x/y/z','x','x/u/v/b','-','x/y','x/y/z','x','x/u/v/w'],['1','3','3','2','4','2','5','3','6','3','5','1','1','1']]).T df.columns = ['col1','col2','col3','col4','col5'] df: col1 col2 col3 col4 col5 0 1.1 A 1.1 x/y/z 1 1 1.1 A 1.7 x/y 3 2 1.1 A 2.5 x/y/z/n 3 …
165 python  pandas  dataframe 

4
So fügen Sie einem Pandas DataFrame eine Kopfzeile hinzu
Ich lese eine CSV-Datei in pandas. Diese CSV-Datei besteht aus vier Spalten und einigen Zeilen, hat jedoch keine Kopfzeile, die ich hinzufügen möchte. Ich habe Folgendes versucht: Cov = pd.read_csv("path/to/file.txt", sep='\t') Frame=pd.DataFrame([Cov], columns = ["Sequence", "Start", "End", "Coverage"]) Frame.to_csv("path/to/file.txt", sep='\t') Wenn ich den Code anwende, wird der folgende Fehler angezeigt: …
165 python  csv  pandas  header 


4
Pandas DataFrame zur Liste der Wörterbücher
Ich habe den folgenden DataFrame: Kundenartikel1 Artikel2 Artikel3 1 Apfelmilchtomate 2 Wasserorangenkartoffel 3 Saft Mango Chips was ich es in eine Liste von Wörterbüchern pro Zeile übersetzen möchte rows = [{'customer': 1, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'}, {'customer': 2, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'}, {'customer': 3, 'item1': 'juice', …


8
Nehmen Sie mehrere Listen in den Datenrahmen auf
Wie nehme ich mehrere Listen und füge sie als unterschiedliche Spalten in einen Python-Datenrahmen ein? Ich habe diese Lösung ausprobiert , hatte aber einige Probleme. Versuch 1: Haben Sie drei Listen, komprimieren Sie sie und verwenden Sie diese res = zip(lst1,lst2,lst3) Ergibt nur eine Spalte Versuch 2: percentile_list = pd.DataFrame({'lst1Tite' …
164 python  numpy  pandas 

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.