Als «pandas» getaggte Fragen

Pandas ist eine Python-Bibliothek zur Datenmanipulation und -analyse, z. B. Datenrahmen, mehrdimensionale Zeitreihen und Querschnittsdatensätze, die häufig in Statistiken, experimentellen wissenschaftlichen Ergebnissen, Ökonometrie oder Finanzen verwendet werden. Pandas ist eine der wichtigsten Data Science-Bibliotheken in Python.

4
Entfernen Sie den Indexnamen in Pandas
Ich habe einen Datenrahmen wie diesen: In [10]: df Out[10]: Column 1 foo Apples 1 Oranges 2 Puppies 3 Ducks 4 Wie entferne index name fooich aus diesem Datenrahmen? Die gewünschte Ausgabe lautet wie folgt: In [10]: df Out[10]: Column 1 Apples 1 Oranges 2 Puppies 3 Ducks 4

3
Python-Pandas konvertieren den Index in datetime
Wie konvertiere ich einen Pandas-Index von Zeichenfolgen in das Datum / Uhrzeit-Format? Mein Datenrahmen 'df' ist so value 2015-09-25 00:46 71.925000 2015-09-25 00:47 71.625000 2015-09-25 00:48 71.333333 2015-09-25 00:49 64.571429 2015-09-25 00:50 72.285714 aber der index ist vom typ string, aber ich brauche ein datetime format, weil ich den fehler …
77 python  pandas 

2
Anhängen von Pandas-Datenrahmen, die in einer for-Schleife generiert wurden
Ich greife auf eine Reihe von Excel-Dateien in einer for-Schleife zu. Ich habe dann die Daten in der Excel-Datei in einen Pandas-Datenrahmen gelesen. Ich kann nicht herausfinden, wie diese Datenrahmen zusammengefügt werden, um dann den Datenrahmen (der jetzt die Daten aus allen Dateien enthält) als neue Excel-Datei zu speichern. Folgendes …
77 python  pandas 


3
Was ist der Unterschied zwischen der Verwendung von loc und der Verwendung von nur eckigen Klammern zum Filtern nach Spalten in Pandas / Python?
Ich habe drei Methoden zum Auswählen einer Spalte in einem Pandas DataFrame festgestellt: Erste Methode zur Auswahl einer Spalte mit loc: df_new = df.loc[:, 'col1'] Zweite Methode - scheint einfacher und schneller: df_new = df['col1'] Dritte Methode - am bequemsten: df_new = df.col1 Gibt es einen Unterschied zwischen diesen drei …

3
Umgang mit variabler Spaltenanzahl mit Pandas - Python
Ich habe einen Datensatz, der so aussieht (höchstens 5 Spalten - kann aber kleiner sein) 1,2,3 1,2,3,4 1,2,3,4,5 1,2 1,2,3,4 .... Ich versuche, pandas read_table zu verwenden, um dies in einen 5-Spalten-Datenrahmen einzulesen. Ich möchte dies ohne zusätzliche Massage einlesen. Wenn ich es versuche import pandas as pd my_cols=['A','B','C','D','E'] my_df=pd.read_table(path,sep=',',header=None,names=my_cols) …
76 python  pandas 

10
Mischen / Permutieren eines DataFrame in Pandas
Was ist eine einfache und effiziente Möglichkeit, einen Datenrahmen in Pandas nach Zeilen oder Spalten zu mischen? Dh wie man eine Funktion schreibt shuffle(df, n, axis=0), die einen Datenrahmen, eine Anzahl von Mischvorgängen nund eine Achse ( axis=0ist Zeilen, axis=1ist Spalten) verwendet und eine Kopie des Datenrahmens zurückgibt, der nmal …
76 python  numpy  pandas 


10
Ist es möglich, Fuzzy Match Merge mit Python Pandas durchzuführen?
Ich habe zwei DataFrames, die ich basierend auf einer Spalte zusammenführen möchte. Aufgrund alternativer Schreibweisen, unterschiedlicher Anzahl von Leerzeichen, Fehlen / Vorhandensein diakritischer Zeichen möchte ich jedoch in der Lage sein, zusammenzuführen, solange sie einander ähnlich sind. Jeder Ähnlichkeitsalgorithmus reicht aus (Soundex, Levenshtein, Difflib). Angenommen, ein DataFrame enthält die folgenden …
76 python  pandas 

14
Python: Pandas pd.read_excel mit ImportError: Installieren Sie xlrd> = 0.9.0 für die Excel-Unterstützung
Ich versuche ein .xlsxmit Pandas zu lesen , erhalte aber den folgenden Fehler: data = pd.read_excel(low_memory=False, io="DataAnalysis1/temp1.xlsx").fillna(value=0) Traceback (most recent call last): File "/Users/Vineeth/PycharmProjects/DataAnalysis1/try1.py", line 9, in <module> data = pd.read_excel(low_memory=False, io="DataAnalysis1/temp1.xlsx").fillna(value=0) File "/Users/Vineeth/venv/lib/python2.7/site-packages/pandas/util/_decorators.py", line 118, in wrapper return func(*args, **kwargs) File "/Users/Vineeth/venv/lib/python2.7/site-packages/pandas/io/excel.py", line 230, in read_excel io = ExcelFile(io, …

3
Wie lese ich eine Parkettdatei in Pandas DataFrame?
Wie kann man einen Parkett-Datensatz von bescheidener Größe in einen speicherinternen Pandas DataFrame lesen, ohne eine Cluster-Computing-Infrastruktur wie Hadoop oder Spark einzurichten? Dies ist nur eine mäßige Datenmenge, die ich mit einem einfachen Python-Skript auf einem Laptop im Speicher lesen möchte. Die Daten befinden sich nicht in HDFS. Es befindet …
76 python  pandas  parquet  blaze 



8
So fügen Sie einer Pandas-Serie ein einzelnes Element hinzu
Wie füge ich einer serialisierten Panda-Serie ein einzelnes Element hinzu? Ich weiß, dass es in Bezug auf das Gedächtnis nicht die effizienteste Art ist, aber das muss ich noch tun. Etwas mit: >> x = Series() >> N = 4 >> for i in xrange(N): >> x.some_appending_function(i**2) >> print x …
75 python  pandas 

7
So wählen Sie die letzte Spalte des Datenrahmens aus
Ich habe nach der Antwort auf diese Frage gesucht, aber alles, was ich herausfinden kann, ist Folgendes: df[df.columns[len(df.columns)-1]] was mir unweildy und unpythonisch (und langsam?) erscheint. Was ist der einfachste Weg, um die Daten für die letzte Spalte in einem Pandas-Datenrahmen auszuwählen, ohne den Namen der Spalte anzugeben?
75 python  pandas 

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.