Als «pandas» getaggte Fragen

Pandas ist eine Python-Bibliothek zur Datenmanipulation und -analyse, z. B. Datenrahmen, mehrdimensionale Zeitreihen und Querschnittsdatensätze, die häufig in Statistiken, experimentellen wissenschaftlichen Ergebnissen, Ökonometrie oder Finanzen verwendet werden. Pandas ist eine der wichtigsten Data Science-Bibliotheken in Python.

11
Wählen Sie durch Teilzeichenfolge aus einem Pandas DataFrame
Ich habe eine DataFramemit 4 Spalten, von denen 2 Zeichenfolgenwerte enthalten. Ich habe mich gefragt, ob es eine Möglichkeit gibt, Zeilen basierend auf einer teilweisen Zeichenfolgenübereinstimmung mit einer bestimmten Spalte auszuwählen. Mit anderen Worten, eine Funktion oder Lambda-Funktion, die so etwas tun würde re.search(pattern, cell_in_question) Rückgabe eines Booleschen Werts. Ich …


7
Erhalten Sie Statistiken für jede Gruppe (wie Anzahl, Mittelwert usw.) mit pandas GroupBy?
Ich habe einen Datenrahmen dfund verwende mehrere Spalten daraus, um groupby: df['col1','col2','col3','col4'].groupby(['col1','col2']).mean() Auf die obige Weise bekomme ich fast die Tabelle (Datenrahmen), die ich brauche. Was fehlt, ist eine zusätzliche Spalte, die die Anzahl der Zeilen in jeder Gruppe enthält. Mit anderen Worten, ich habe gemein, aber ich würde auch …

7
So filtern Sie Pandas-Datenrahmen mit 'in' und 'nicht in' wie in SQL
Wie kann ich die Entsprechungen von SQL INund erreichen NOT IN? Ich habe eine Liste mit den erforderlichen Werten. Hier ist das Szenario: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = ['UK','China'] # pseudo-code: df[df['countries'] not in countries] Meine derzeitige Vorgehensweise ist wie folgt: df = pd.DataFrame({'countries':['US','UK','Germany','China']}) countries = pd.DataFrame({'countries':['UK','China'], 'matched':True}) # IN …

17
UnicodeDecodeError beim Lesen einer CSV-Datei in Pandas mit Python
Ich führe ein Programm aus, das 30.000 ähnliche Dateien verarbeitet. Eine zufällige Anzahl von ihnen stoppt und erzeugt diesen Fehler ... File "C:\Importer\src\dfman\importer.py", line 26, in import_chr data = pd.read_csv(filepath, names=fields) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 400, in parser_f return _read(filepath_or_buffer, kwds) File "C:\Python33\lib\site-packages\pandas\io\parsers.py", line 205, in _read return parser.read() File "C:\Python33\lib\site-packages\pandas\io\parsers.py", …




15
Das Konstruieren von Pandas DataFrame aus Werten in Variablen ergibt "ValueError: Wenn Sie alle Skalarwerte verwenden, müssen Sie einen Index übergeben".
Dies mag eine einfache Frage sein, aber ich kann nicht herausfinden, wie das geht. Nehmen wir an, ich habe zwei Variablen wie folgt. a = 2 b = 3 Ich möchte daraus einen DataFrame erstellen: df2 = pd.DataFrame({'A':a,'B':b}) Dies erzeugt einen Fehler: ValueError: Wenn Sie alle Skalarwerte verwenden, müssen Sie …

6
Der Wahrheitswert einer Serie ist nicht eindeutig. Verwenden Sie a.empty, a.bool (), a.item (), a.any () oder a.all ()
Probleme beim Filtern meines Ergebnisdatenrahmens mit einer orBedingung. Ich möchte, dass mein Ergebnis dfalle Spaltenwerte extrahiert var, die über 0,25 und unter -0,25 liegen. Diese Logik gibt mir einen mehrdeutigen Wahrheitswert, funktioniert jedoch, wenn ich diese Filterung in zwei separate Operationen aufteile. Was passiert hier? Ich bin mir nicht sicher, …

12
So wenden Sie eine Funktion auf zwei Spalten des Pandas-Datenrahmens an
Angenommen, ich habe eine, dfdie Spalten von hat 'ID', 'col_1', 'col_2'. Und ich definiere eine Funktion: f = lambda x, y : my_function_expression. Jetzt möchte ich die beiden Spalten von to anwenden f, um eine neue Spalte elementweise zu berechnen , ähnlich wie:df'col_1', 'col_2''col_3' df['col_3'] = df[['col_1','col_2']].apply(f) # Pandas gives …
368 python  pandas  dataframe 

2
Pandas verschmelzen 101
Wie führe ich einen ( LEFT| RIGHT| FULL) ( INNER| OUTER) Join mit Pandas durch? Wie füge ich NaNs für fehlende Zeilen nach dem Zusammenführen hinzu? Wie entferne ich NaNs nach dem Zusammenführen? Kann ich den Index zusammenführen? Cross Join mit Pandas? Wie füge ich mehrere DataFrames zusammen? merge? join? …
363 python  pandas  join  merge 

2
So schwenken Sie einen Datenrahmen
Was ist Pivot? Wie schwenke ich? Ist das ein Dreh- und Angelpunkt? Langformat zu Breitformat? Ich habe viele Fragen zu Pivot-Tabellen gesehen. Selbst wenn sie nicht wissen, dass sie nach Pivot-Tabellen fragen, sind sie es normalerweise. Es ist praktisch unmöglich, eine kanonische Frage und Antwort zu schreiben, die alle Aspekte …

11
Wie erhalte ich einen Wert aus einer Zelle eines Datenrahmens?
Ich habe eine Bedingung erstellt, die genau eine Zeile aus meinem Datenrahmen extrahiert: d2 = df[(df['l_ext']==l_ext) & (df['item']==item) & (df['wn']==wn) & (df['wd']==1)] Jetzt möchte ich einen Wert aus einer bestimmten Spalte entnehmen: val = d2['col_name'] Als Ergebnis erhalte ich jedoch einen Datenrahmen, der eine Zeile und eine Spalte enthält ( …
344 python  pandas  dataframe 

30
Python Pandas Fehler beim Tokenisieren von Daten
Ich versuche, eine CSV-Datei mit Pandas zu bearbeiten, erhalte jedoch folgende Fehlermeldung: pandas.parser.CParserError: Fehler beim Tokenisieren von Daten. C-Fehler: 2 Felder in Zeile 3 erwartet, Säge 12 Ich habe versucht, die Pandas-Dokumente zu lesen, aber nichts gefunden. Mein Code ist einfach: path = 'GOOG Key Ratios.csv' #print(open(path).read()) data = pd.read_csv(path) …
341 python  csv  pandas 

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.