Als «pandas» getaggte Fragen

Pandas ist eine Python-Bibliothek zur Datenmanipulation und -analyse, z. B. Datenrahmen, mehrdimensionale Zeitreihen und Querschnittsdatensätze, die häufig in Statistiken, experimentellen wissenschaftlichen Ergebnissen, Ökonometrie oder Finanzen verwendet werden. Pandas ist eine der wichtigsten Data Science-Bibliotheken in Python.

5
Fügen Sie fehlende Daten zum Pandas-Datenrahmen hinzu
Meine Daten können an einem bestimmten Datum mehrere Ereignisse oder an einem Datum KEINE Ereignisse enthalten. Ich nehme diese Ereignisse, zähle sie nach Datum und zeichne sie auf. Wenn ich sie jedoch zeichne, stimmen meine beiden Serien nicht immer überein. idx = pd.date_range(df['simpleDate'].min(), df['simpleDate'].max()) s = df.groupby(['simpleDate']).size() Im obigen Code …
126 python  date  plot  pandas  dataframe 

6
So halten Sie den Index bei Verwendung von Pandas Merge
Ich möchte zwei zusammenführen DataFramesund den Index aus dem ersten Frame als Index für den zusammengeführten Datensatz beibehalten. Wenn ich jedoch die Zusammenführung durchführe, hat der resultierende DataFrame einen ganzzahligen Index. Wie kann ich angeben, dass der Index vom linken Datenrahmen ferngehalten werden soll? In [4]: a = pd.DataFrame({'col1': {'a': …
126 python  pandas 

8
Verwenden Sie .corr, um die Korrelation zwischen zwei Spalten zu ermitteln
Ich habe den folgenden Pandas-Datenrahmen Top15: Ich erstelle eine Spalte, in der die Anzahl der zitierfähigen Dokumente pro Person geschätzt wird: Top15['PopEst'] = Top15['Energy Supply'] / Top15['Energy Supply per Capita'] Top15['Citable docs per Capita'] = Top15['Citable documents'] / Top15['PopEst'] Ich möchte den Zusammenhang zwischen der Anzahl zitierfähiger Dokumente pro Kopf …

4
So bilden Sie eine Tupelspalte aus zwei Spalten in Pandas
Ich habe einen Pandas DataFrame und möchte die Spalten 'lat' und 'long' zu einem Tupel kombinieren. <class 'pandas.core.frame.DataFrame'> Int64Index: 205482 entries, 0 to 209018 Data columns: Month 205482 non-null values Reported by 205482 non-null values Falls within 205482 non-null values Easting 205482 non-null values Northing 205482 non-null values Location 205482 …

4
datetime dtypes in pandas read_csv
Ich lese in einer CSV-Datei mit mehreren Datetime-Spalten. Ich müsste die Datentypen beim Einlesen der Datei festlegen, aber die Datumszeiten scheinen ein Problem zu sein. Zum Beispiel: headers = ['col1', 'col2', 'col3', 'col4'] dtypes = ['datetime', 'datetime', 'str', 'float'] pd.read_csv(file, sep='\t', header=None, names=headers, dtype=dtypes) Beim Ausführen wird ein Fehler ausgegeben: …

9
Python-Pandas entfernen doppelte Spalten
Was ist der einfachste Weg, um doppelte Spalten aus einem Datenrahmen zu entfernen? Ich lese eine Textdatei mit doppelten Spalten über: import pandas as pd df=pd.read_table(fname) Die Spaltennamen sind: Time, Time Relative, N2, Time, Time Relative, H2, etc... Alle Spalten "Zeit" und "Zeitrelativ" enthalten dieselben Daten. Ich will: Time, Time …
125 python  pandas 



6
Bedingte Pandas ersetzen
Ich habe einen DataFrame und möchte die Werte in einer bestimmten Spalte, die einen Wert überschreiten, durch Null ersetzen. Ich hatte gedacht, dies sei ein Weg, dies zu erreichen: df[df.my_channel > 20000].my_channel = 0 Wenn ich den Kanal in einen neuen Datenrahmen kopiere, ist das ganz einfach: df2 = df.my_channel …

8
Pandas groupby: Wie man eine Vereinigung von Saiten bekommt
Ich habe einen Datenrahmen wie diesen: A B C 0 1 0.749065 This 1 2 0.301084 is 2 3 0.463468 a 3 4 0.643961 random 4 1 0.866521 string 5 2 0.120737 ! Berufung In [10]: print df.groupby("A")["B"].sum() wird zurückkehren A 1 1.615586 2 0.421821 3 0.463468 4 0.643961 Jetzt …
122 python  pandas 


3
Abrufen des Index einer Zeile in einer Pandas-Apply-Funktion
Ich versuche, auf den Index einer Zeile in einer Funktion zuzugreifen, die DataFramein Pandas auf eine gesamte Funktion angewendet wird . Ich habe so etwas: df = pandas.DataFrame([[1,2,3],[4,5,6]], columns=['a','b','c']) >>> df a b c 0 1 2 3 1 4 5 6 und ich werde eine Funktion definieren, die auf …
121 python  pandas  dataframe 

3
Suchen Sie den Spaltennamen mit dem Maximalwert für jede Zeile
Ich habe einen DataFrame wie diesen: In [7]: frame.head() Out[7]: Communications and Search Business General Lifestyle 0 0.745763 0.050847 0.118644 0.084746 0 0.333333 0.000000 0.583333 0.083333 0 0.617021 0.042553 0.297872 0.042553 0 0.435897 0.000000 0.410256 0.153846 0 0.358974 0.076923 0.410256 0.153846 Hier möchte ich fragen, wie man einen Spaltennamen erhält, …
121 python  pandas  dataframe  max 


10
Wie schreibe ich in eine vorhandene Excel-Datei, ohne Daten zu überschreiben (mit Pandas)?
Ich benutze Pandas, um auf folgende Weise in eine Excel-Datei zu schreiben: import pandas writer = pandas.ExcelWriter('Masterfile.xlsx') data_filtered.to_excel(writer, "Main", cols=['Diff1', 'Diff2']) writer.save() Masterfile.xlsx besteht bereits aus mehreren verschiedenen Registerkarten. Es enthält jedoch noch nicht "Main". Pandas schreibt korrekt in das "Haupt" -Blatt, leider werden auch alle anderen Registerkarten gelöscht.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.