Als «dataframe» getaggte Fragen

Ein Datenrahmen ist eine tabellarische Datenstruktur. Normalerweise enthält es Daten, bei denen Zeilen Beobachtungen und Spalten Variablen verschiedener Typen sind. Während "Datenrahmen" oder "Datenrahmen" der Begriff ist, der für dieses Konzept in mehreren Sprachen verwendet wird (R, Apache Spark, deedle, Maple, die Pandas-Bibliothek in Python und die DataFrames-Bibliothek in Julia), ist "Tabelle" der Begriff, der in verwendet wird MATLAB und SQL.

4
So bilden Sie eine Tupelspalte aus zwei Spalten in Pandas
Ich habe einen Pandas DataFrame und möchte die Spalten 'lat' und 'long' zu einem Tupel kombinieren. <class 'pandas.core.frame.DataFrame'> Int64Index: 205482 entries, 0 to 209018 Data columns: Month 205482 non-null values Reported by 205482 non-null values Falls within 205482 non-null values Easting 205482 non-null values Northing 205482 non-null values Location 205482 …

4
datetime dtypes in pandas read_csv
Ich lese in einer CSV-Datei mit mehreren Datetime-Spalten. Ich müsste die Datentypen beim Einlesen der Datei festlegen, aber die Datumszeiten scheinen ein Problem zu sein. Zum Beispiel: headers = ['col1', 'col2', 'col3', 'col4'] dtypes = ['datetime', 'datetime', 'str', 'float'] pd.read_csv(file, sep='\t', header=None, names=headers, dtype=dtypes) Beim Ausführen wird ein Fehler ausgegeben: …

10
Speichern Sie Dataframe in CSV direkt in S3 Python
Ich habe einen Pandas DataFrame, den ich in eine neue CSV-Datei hochladen möchte. Das Problem ist, dass ich die Datei nicht lokal speichern möchte, bevor ich sie auf s3 übertrage. Gibt es eine Methode wie to_csv, um den Datenrahmen direkt in s3 zu schreiben? Ich benutze boto3. Folgendes habe ich …

12
data.frame Zeilen zu einer Liste
Ich habe einen data.frame, den ich zeilenweise in eine Liste konvertieren möchte, was bedeutet, dass jede Zeile ihren eigenen Listenelementen entspricht. Mit anderen Worten, ich möchte eine Liste, die so lang ist, wie der data.frame Zeilen enthält. Bisher habe ich dieses Problem folgendermaßen angegangen, aber ich habe mich gefragt, ob …
123 list  r  dataframe 


7
So hängen Sie Zeilen an einen R-Datenrahmen an
Ich habe mich in StackOverflow umgesehen, kann jedoch keine spezifische Lösung für mein Problem finden, bei der Zeilen an einen R-Datenrahmen angehängt werden. Ich initialisiere einen leeren 2-Spalten-Datenrahmen wie folgt. df = data.frame(x = numeric(), y = character()) Dann ist es mein Ziel, eine Werteliste zu durchlaufen und in jeder …
121 r  merge  append  dataframe  rows 

8
Wählen Sie Datenrahmenspalten dynamisch mit $ und einem Zeichenwert aus
Ich habe einen Vektor mit verschiedenen Spaltennamen und möchte in der Lage sein, jeden von ihnen zu durchlaufen, um diese Spalte aus einem data.frame zu extrahieren. Betrachten Sie beispielsweise den Datensatz mtcarsund einige Variablennamen, die in einem Zeichenvektor gespeichert sind cols. Wenn ich versuche, eine Variable aus mtcarseiner dynamischen Teilmenge …
121 r  dataframe  r-faq 

3
Abrufen des Index einer Zeile in einer Pandas-Apply-Funktion
Ich versuche, auf den Index einer Zeile in einer Funktion zuzugreifen, die DataFramein Pandas auf eine gesamte Funktion angewendet wird . Ich habe so etwas: df = pandas.DataFrame([[1,2,3],[4,5,6]], columns=['a','b','c']) >>> df a b c 0 1 2 3 1 4 5 6 und ich werde eine Funktion definieren, die auf …
121 python  pandas  dataframe 

14
Zählen Sie die Anzahl der Zeilen innerhalb jeder Gruppe
Ich habe einen Datenrahmen und möchte die Anzahl der Zeilen innerhalb jeder Gruppe zählen. Ich benutze die aggregateFunktion regelmäßig, um Daten wie folgt zu summieren: df2 <- aggregate(x ~ Year + Month, data = df1, sum) Jetzt möchte ich Beobachtungen zählen, kann aber anscheinend nicht das richtige Argument dafür finden …
121 r  dataframe  aggregate  r-faq 

3
Suchen Sie den Spaltennamen mit dem Maximalwert für jede Zeile
Ich habe einen DataFrame wie diesen: In [7]: frame.head() Out[7]: Communications and Search Business General Lifestyle 0 0.745763 0.050847 0.118644 0.084746 0 0.333333 0.000000 0.583333 0.083333 0 0.617021 0.042553 0.297872 0.042553 0 0.435897 0.000000 0.410256 0.153846 0 0.358974 0.076923 0.410256 0.153846 Hier möchte ich fragen, wie man einen Spaltennamen erhält, …
121 python  pandas  dataframe  max 


5
Übergeben Sie einen data.frame-Spaltennamen an eine Funktion
Ich versuche eine Funktion zu schreiben, um ein data.frame ( x) und ein columndavon zu akzeptieren . Die Funktion führt einige Berechnungen für x durch und gibt später einen anderen data.frame zurück. Ich bleibe bei der Best-Practice-Methode, um den Spaltennamen an die Funktion zu übergeben. Die beide minimal Beispiele fun1und …
119 r  dataframe  r-faq 

3
Wie teste ich, ob eine Zeichenfolge in Pandas eine der Teilzeichenfolgen in einer Liste enthält?
Gibt es eine Funktion, die einer Kombination von entspricht? df.isin() und entspricht df[col].str.contains()? Angenommen, ich habe die Serie s = pd.Series(['cat','hat','dog','fog','pet']) und möchte alle Orte finden, an denen sich eine sbefindet ['og', 'at']. Ich möchte alles außer "Haustier" erhalten. Ich habe eine Lösung, aber sie ist ziemlich unelegant: searchfor = …

1
Welche Regeln verwendet Pandas, um eine Ansicht gegenüber einer Kopie zu generieren?
Ich bin verwirrt über die Regeln, die Pandas verwendet, wenn er entscheidet, dass eine Auswahl aus einem Datenrahmen eine Kopie des ursprünglichen Datenrahmens oder eine Ansicht des Originals ist. Wenn ich zum Beispiel habe df = pd.DataFrame(np.random.randn(8,8), columns=list('ABCDEFGH'), index=range(1,9)) Ich verstehe, dass ein queryeine Kopie zurückgibt, so dass so etwas …


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.