Als «pandas» getaggte Fragen

Pandas ist eine Python-Bibliothek zur Datenmanipulation und -analyse, z. B. Datenrahmen, mehrdimensionale Zeitreihen und Querschnittsdatensätze, die häufig in Statistiken, experimentellen wissenschaftlichen Ergebnissen, Ökonometrie oder Finanzen verwendet werden. Pandas ist eine der wichtigsten Data Science-Bibliotheken in Python.

7
Pandas So filtern Sie eine Serie
Ich habe eine Serie wie diese, nachdem ich groupby ('name') ausgeführt und die Funktion mean () für eine andere Spalte verwendet habe name 383 3.000000 663 1.000000 726 1.000000 737 9.000000 833 8.166667 Könnte mir bitte jemand zeigen, wie man die Zeilen mit 1.000000 Mittelwerten herausfiltert? Vielen Dank und ich …
89 python  pandas 



13
Vergleichen von zwei Datenrahmen und Ermitteln der Unterschiede
Ich habe zwei Datenrahmen. Beispiele: df1: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green df2: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green 2013-11-25 Apple 22.1 …

2
Speichern Sie die Liste der DataFrames in einer Excel-Tabelle mit mehreren Blättern
Wie kann ich eine Liste von DataFrames in eine Excel-Tabelle exportieren? Die Dokumente für den to_excelStatus: Hinweise Wenn Sie ein vorhandenes ExcelWriter-Objekt übergeben, wird das Blatt zur vorhandenen Arbeitsmappe hinzugefügt. Dies kann verwendet werden, um verschiedene DataFrames in einer Arbeitsmappe zu speichern writer = ExcelWriter('output.xlsx') df1.to_excel(writer, 'sheet1') df2.to_excel(writer, 'sheet2') writer.save() …

7
So importieren Sie eine Textdatei in AWS S3 in Pandas, ohne auf die Festplatte zu schreiben
Ich habe eine Textdatei in S3 gespeichert, die eine tabulatorgetrennte Tabelle ist. Ich möchte es in Pandas laden, kann es aber nicht zuerst speichern, da ich auf einem Heroku-Server laufe. Folgendes habe ich bisher. import io import boto3 import os import pandas as pd os.environ["AWS_ACCESS_KEY_ID"] = "xxxxxxxx" os.environ["AWS_SECRET_ACCESS_KEY"] = "xxxxxxxx" …

5
Erstellen Sie Pandas DataFrame aus Elementen im verschachtelten Wörterbuch
Angenommen, ich habe ein verschachteltes Wörterbuch 'user_dict' mit folgender Struktur: Stufe 1: UserId (Long Integer) Stufe 2: Kategorie (String) Stufe 3: Verschiedene Attribute (Floats, Ints usw.) Ein Eintrag in diesem Wörterbuch wäre beispielsweise: user_dict[12] = { "Category 1": {"att_1": 1, "att_2": "whatever"}, "Category 2": {"att_1": 23, "att_2": "another"}} Jedes Element …


1
Was sind die Unterschiede zwischen Feder und Parkett?
Beide sind Spalten- (Platten-) Speicherformate zur Verwendung in Datenanalysesystemen. Beide sind in Apache Arrow ( Pyarrow- Paket für Python) integriert und entsprechen Arrow als säulenförmige In-Memory-Analyseebene. Wie unterscheiden sich beide Formate? Sollten Sie bei der Arbeit mit Pandas nach Möglichkeit immer Federn bevorzugen? Was sind die Anwendungsfälle, in denen Federn …

5
Spalte im Pandas-Datenrahmen um eins verschieben?
Ich habe einen Pandas-Datenrahmen. Ich möchte eine meiner Spalten "hinterherhinken". Dies bedeutet beispielsweise, dass die gesamte Spalte 'gdp' um eins nach oben verschoben und dann alle überschüssigen Daten am Ende der verbleibenden Zeilen entfernt werden, sodass alle Spalten wieder gleich lang sind. df = y gdp cap 0 1 2 …

1
Effizientes paralleles Anwenden einer Funktion auf einen gruppierten Pandas DataFrame
Ich muss oft eine Funktion auf die Gruppen eines sehr großen DataFrame(gemischten Datentyps) anwenden und möchte mehrere Kerne nutzen. Ich kann einen Iterator aus den Gruppen erstellen und das Multiprozessor-Modul verwenden, aber es ist nicht effizient, da jede Gruppe und die Ergebnisse der Funktion für die Nachrichtenübermittlung zwischen Prozessen ausgewählt …

6
Konvertieren Sie Pandas-Serien in DataFrame
Ich habe eine Pandas-Serie sf: email email1@email.com [1.0, 0.0, 0.0] email2@email.com [2.0, 0.0, 0.0] email3@email.com [1.0, 0.0, 0.0] email4@email.com [4.0, 0.0, 0.0] email5@email.com [1.0, 0.0, 3.0] email6@email.com [1.0, 5.0, 0.0] Und ich möchte es in den folgenden DataFrame umwandeln: index | email | list _____________________________________________ 0 | email1@email.com | [1.0, …

11
Hinzufügen von Metainformationen / Metadaten zu Pandas DataFrame
Ist es möglich, einem Pandas DataFrame einige Metainformationen / Metadaten hinzuzufügen? Zum Beispiel der Name des Instruments, mit dem die Daten gemessen werden, das verantwortliche Instrument usw. Eine Problemumgehung wäre, eine Spalte mit diesen Informationen zu erstellen, aber es erscheint verschwenderisch, in jeder Zeile eine einzelne Information zu speichern!
88 python  pandas 

5
Konvertieren von Django QuerySet in Pandas DataFrame
Ich werde ein Django QuerySet DataFramewie folgt in ein Pandas konvertieren : qs = SomeModel.objects.select_related().filter(date__year=2012) q = qs.values('date', 'OtherField') df = pd.DataFrame.from_records(q) Es funktioniert, aber gibt es einen effizienteren Weg?
88 python  django  pandas 

7
Streudiagramme in Pandas / Pyplot: So zeichnen Sie nach Kategorien
Ich versuche, mit einem Pandas DataFrame-Objekt ein einfaches Streudiagramm in Pyplot zu erstellen, möchte aber eine effiziente Methode zum Zeichnen von zwei Variablen, wobei die Symbole durch eine dritte Spalte (Schlüssel) vorgegeben werden. Ich habe verschiedene Möglichkeiten mit df.groupby ausprobiert, aber nicht erfolgreich. Ein Beispiel für ein df-Skript finden Sie …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.