Als «pandas» getaggte Fragen

Pandas ist eine Python-Bibliothek zur Datenmanipulation und -analyse, z. B. Datenrahmen, mehrdimensionale Zeitreihen und Querschnittsdatensätze, die häufig in Statistiken, experimentellen wissenschaftlichen Ergebnissen, Ökonometrie oder Finanzen verwendet werden. Pandas ist eine der wichtigsten Data Science-Bibliotheken in Python.

4
Pandas Merge - So vermeiden Sie das Duplizieren von Spalten
Ich versuche eine Zusammenführung zwischen zwei Datenrahmen. Jeder Datenrahmen hat zwei Indexebenen (Datum, Cusip). In den Spalten stimmen einige Spalten beispielsweise zwischen den beiden überein (Währung, Einstellungsdatum). Was ist der beste Weg, um diese nach Index zusammenzuführen, aber nicht zwei Kopien der Währung und des Adj-Datums zu nehmen. Jeder Datenrahmen …
93 python  pandas 


9
Python Pandas-Äquivalent in JavaScript
Mit diesem CSV-Beispiel: Source,col1,col2,col3 foo,1,2,3 bar,3,4,5 Die Standardmethode, die ich für Pandas verwende, ist folgende: CSV analysieren Wählen Sie Spalten in einem Datenrahmen aus ( col1und col3) Verarbeiten Sie die Spalte (z. B. die durchschnittlichen Werte von col1und col3) Gibt es eine JavaScript-Bibliothek, die Pandas mag?

5
Zeichnen Sie verschiedene DataFrames in derselben Abbildung
Ich habe eine Temperaturdatei mit langjährigen Temperaturaufzeichnungen in einem Format wie folgt: 2012-04-12,16:13:09,20.6 2012-04-12,17:13:09,20.9 2012-04-12,18:13:09,20.6 2007-05-12,19:13:09,5.4 2007-05-12,20:13:09,20.6 2007-05-12,20:13:09,20.6 2005-08-11,11:13:09,20.6 2005-08-11,11:13:09,17.5 2005-08-13,07:13:09,20.6 2006-04-13,01:13:09,20.6 Jedes Jahr hat eine andere Anzahl, Uhrzeit der Aufzeichnungen, daher sind die Datums- / Uhrzeitindizes der Pandas alle unterschiedlich. Ich möchte die Daten des verschiedenen Jahres zum Vergleich …

6
Haben Pandas Iterrows Leistungsprobleme?
Ich habe eine sehr schlechte Leistung bei der Verwendung von Iterrows von Pandas festgestellt. Ist das etwas, was andere erleben? Ist es spezifisch für Iterrows und sollte diese Funktion für Daten einer bestimmten Größe vermieden werden (ich arbeite mit 2-3 Millionen Zeilen)? Diese Diskussion auf GitHub hat mich zu der …




4
Verketten Sie Zeichenfolgen aus mehreren Zeilen mit Pandas groupby
Ich möchte mehrere Zeichenfolgen in einem Datenrahmen zusammenführen, der auf einer Gruppierung in Pandas basiert. Dies ist mein bisheriger Code: import pandas as pd from io import StringIO data = StringIO(""" "name1","hej","2014-11-01" "name1","du","2014-11-02" "name1","aj","2014-12-01" "name1","oj","2014-12-02" "name2","fin","2014-11-01" "name2","katt","2014-11-02" "name2","mycket","2014-12-01" "name2","lite","2014-12-01" """) # load string as stream into dataframe df = pd.read_csv(data,header=0, …

6
Großer, beständiger DataFrame bei Pandas
Ich erforsche die Umstellung auf Python und Pandas als langjähriger SAS-Benutzer. Als ich heute einige Tests durchführte, war ich überrascht, dass Python beim Versuch, pandas.read_csv()eine 128-MB-CSV-Datei zu erstellen, nicht genügend Speicherplatz hatte . Es hatte ungefähr 200.000 Zeilen und 200 Spalten mit meist numerischen Daten. Mit SAS kann ich eine …
91 python  pandas  sas 

6
wie man ein Diagramm in einer Schleife in ipython notebook dynamisch aktualisiert (innerhalb einer Zelle)
Umgebung: Python 2.7, Matplotlib 1.3, IPython Notebook 1.1, Linux, Chrome. Der Code befindet sich in einer einzelnen Eingabezelle mit--pylab=inline Ich möchte IPython-Notebook und Pandas verwenden, um einen Stream zu konsumieren und alle 5 Sekunden einen Plot dynamisch zu aktualisieren. Wenn ich nur die print-Anweisung verwende, um die Daten im Textformat …


3
Die Gesamtzahl der Pandas ist unterschiedlich
Angenommen, ich habe ein Protokoll der Benutzeraktivität und möchte einen Bericht über die Gesamtdauer und die Anzahl der eindeutigen Benutzer pro Tag erstellen. import numpy as np import pandas as pd df = pd.DataFrame({'date': ['2013-04-01','2013-04-01','2013-04-01','2013-04-02', '2013-04-02'], 'user_id': ['0001', '0001', '0002', '0002', '0002'], 'duration': [30, 15, 20, 15, 30]}) Die Gesamtdauer …
91 python  pandas 



Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.