Ich möchte mehrere CSV-Dateien aus einem Verzeichnis in Pandas lesen und sie zu einem großen DataFrame verketten. Ich habe es allerdings nicht herausgefunden. Folgendes habe ich bisher:
import glob
import pandas as pd
# get data file names
path =r'C:\DRO\DCL_rawdata_files'
filenames = glob.glob(path + "/*.csv")
dfs = []
for filename in filenames:
dfs.append(pd.read_csv(filename))
# Concatenate all data into one DataFrame
big_frame = pd.concat(dfs, ignore_index=True)
Ich denke ich brauche etwas Hilfe innerhalb der for-Schleife ???
big_frame = pd.concat(dfs, ignore_index=True)
? Wenn Sie eine Liste von Datenrahmen haben, müssen Sie die Liste durchlaufen und sich anbig_frame
dfs
jetzt eine Schleife durchführen , damit so etwas wie for df in dfs: big_frame.concat(df, ignore_index=True)
funktionieren sollte. Sie können es auch versuchen, append
anstatt concat
auch.
concat
sollte eine Liste von DataFrames genauso gut verarbeiten wie Sie. Ich denke, das ist ein sehr guter Ansatz.
dfs
Liste, finden Sie nicht die Linie ersetzen möchtendata = pd.read_csv(filename)
mitdfs.append(pd.read_csv(filename)
. Sie müssten dann die Liste durchlaufen undconcat
ich glaube nicht, dassconcat
eine Liste vondf
s funktioniert .