Als «pandas» getaggte Fragen

Pandas ist eine Python-Bibliothek zur Datenmanipulation und -analyse, z. B. Datenrahmen, mehrdimensionale Zeitreihen und Querschnittsdatensätze, die häufig in Statistiken, experimentellen wissenschaftlichen Ergebnissen, Ökonometrie oder Finanzen verwendet werden. Pandas ist eine der wichtigsten Data Science-Bibliotheken in Python.

2
Binning-Säule mit Python-Pandas
Ich habe eine Datenrahmenspalte mit numerischen Werten: df['percentage'].head() 46.5 44.2 100.0 42.12 Ich möchte die Spalte als Bin Count sehen: bins = [0, 1, 5, 10, 25, 50, 100] Wie kann ich das Ergebnis als Behälter mit ihren erhalten value counts? [0, 1] bin amount [1, 5] etc [5, 10] …

9
Rückgabe mehrerer Spalten von pandas apply ()
Ich habe einen Pandas DataFrame , df_test. Es enthält eine Spalte 'Größe', die die Größe in Bytes darstellt. Ich habe KB, MB und GB mit dem folgenden Code berechnet: df_test = pd.DataFrame([ {'dir': '/Users/uname1', 'size': 994933}, {'dir': '/Users/uname2', 'size': 109338711}, ]) df_test['size_kb'] = df_test['size'].astype(int).apply(lambda x: locale.format("%.1f", x / 1024.0, grouping=True) …


11
FutureWarning: elementweiser Vergleich fehlgeschlagen; Rückgabe des Skalars, aber in Zukunft wird ein elementweiser Vergleich durchgeführt
Ich verwende Pandas 0.19.1unter Python 3. Ich erhalte eine Warnung in diesen Codezeilen. Ich versuche, eine Liste zu erhalten, die alle Zeilennummern enthält, in denen die Zeichenfolge Peterin der Spalte vorhanden ist Unnamed: 5. df = pd.read_excel(xls_path) myRows = df[df['Unnamed: 5'] == 'Peter'].index.tolist() Es wird eine Warnung ausgegeben: "\Python36\lib\site-packages\pandas\core\ops.py:792: FutureWarning: …


5
Stellen Sie einem Pandas MultiIndex ein Level voran
Ich habe einen DataFrame mit einem MultiIndex, der nach einer Gruppierung erstellt wurde: import numpy as np import pandas as p from numpy.random import randn df = p.DataFrame({ 'A' : ['a1', 'a1', 'a2', 'a3'] , 'B' : ['b1', 'b2', 'b3', 'b4'] , 'Vals' : randn(4) }).groupby(['A', 'B']).sum() df Output> Vals …
98 python  pandas 

12
Gibt es eine Möglichkeit, die Breite von Excel-Spalten mit pandas.ExcelWriter automatisch anzupassen?
Ich werde gebeten, einige Excel-Berichte zu erstellen. Ich verwende derzeit ziemlich häufig Pandas für meine Daten, daher möchte ich natürlich die pandas.ExcelWriter-Methode verwenden, um diese Berichte zu generieren. Die festen Spaltenbreiten sind jedoch ein Problem. Der Code, den ich bisher habe, ist einfach genug. Angenommen, ich habe einen Datenrahmen mit …

13
Python-Pandas und Datenbanken wie MySQL
Die Dokumentation für Pandas enthält zahlreiche Beispiele für bewährte Methoden für die Arbeit mit Daten, die in verschiedenen Formaten gespeichert sind. Ich kann jedoch keine guten Beispiele für die Arbeit mit Datenbanken wie beispielsweise MySQL finden. Kann mich jemand auf Links verweisen oder einige Codefragmente geben, wie Abfrageergebnisse mit mysql-python …
97 python  pandas 

4
Häufigkeitstabelle für eine einzelne Variable
Eine letzte Frage für Pandas-Neulinge an diesem Tag: Wie erstelle ich eine Tabelle für eine einzelne Serie? Beispielsweise: my_series = pandas.Series([1,2,2,3,3,3]) pandas.magical_frequency_function( my_series ) >> { 1 : 1, 2 : 2, 3 : 3 } Viel googeln hat mich zu Series.describe () und pandas.crosstabs geführt, aber keines von beiden …

6
So setzen Sie eine Zelle in einem Pandas-Datenrahmen auf NaN
Ich möchte schlechte Werte in einer Spalte eines Datenrahmens durch NaNs ersetzen. mydata = {'x' : [10, 50, 18, 32, 47, 20], 'y' : ['12', '11', 'N/A', '13', '15', 'N/A']} df = pd.DataFrame(mydata) df[df.y == 'N/A']['y'] = np.nan Die letzte Zeile schlägt jedoch fehl und gibt eine Warnung aus, da …
97 python  pandas  nan 

6
Wie filtert man Pandas-Datenrahmen nach mehreren Spalten?
Um einen Datenrahmen (df) nach einer einzelnen Spalte zu filtern, können wir, wenn wir Daten mit Männern und Frauen berücksichtigen, Folgendes tun: males = df[df[Gender]=='Male'] Frage 1 - Aber was ist, wenn sich die Daten über mehrere Jahre erstrecken und ich für 2014 nur Männer sehen wollte? In anderen Sprachen …
97 python  filter  pandas 

6
Überspringen Sie Zeilen während des CSV-Imports von Pandas
Ich versuche, eine CSV-Datei mit pandas.read_csv()zu importieren, möchte jedoch nicht die zweite Zeile der Datendatei importieren (die Zeile mit dem Index = 1 für die 0-Indizierung). Ich kann nicht sehen, wie ich es nicht importieren soll, da die mit dem Befehl verwendeten Argumente nicht eindeutig sind: Von der Pandas-Website: skiprows …
97 python  csv  pandas 

7
Vergleichen Sie zwei Spalten mit Pandas
Verwenden Sie dies als Ausgangspunkt: a = [['10', '1.2', '4.2'], ['15', '70', '0.03'], ['8', '5', '0']] df = pd.DataFrame(a, columns=['one', 'two', 'three']) Out[8]: one two three 0 10 1.2 4.2 1 15 70 0.03 2 8 5 0 Ich möchte so etwas wie eine ifAussage innerhalb von Pandas verwenden. if …


4
Zeichenfolgen in einem DataFrame, aber dtype ist ein Objekt
Warum sagt mir Pandas, dass ich Objekte habe, obwohl jedes Element in der ausgewählten Spalte eine Zeichenfolge ist - auch nach expliziter Konvertierung. Dies ist mein DataFrame: <class 'pandas.core.frame.DataFrame'> Int64Index: 56992 entries, 0 to 56991 Data columns (total 7 columns): id 56992 non-null values attr1 56992 non-null values attr2 56992 …
96 python  pandas  numpy  types  series 

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.