Als «pandas» getaggte Fragen

Pandas ist eine Python-Bibliothek zur Datenmanipulation und -analyse, z. B. Datenrahmen, mehrdimensionale Zeitreihen und Querschnittsdatensätze, die häufig in Statistiken, experimentellen wissenschaftlichen Ergebnissen, Ökonometrie oder Finanzen verwendet werden. Pandas ist eine der wichtigsten Data Science-Bibliotheken in Python.


12
Wie importiere ich Daten von Mongodb in Pandas?
Ich habe eine große Datenmenge in einer Sammlung in Mongodb, die ich analysieren muss. Wie importiere ich diese Daten in Pandas? Ich bin neu in Pandas und Numpy. BEARBEITEN: Die Mongodb-Sammlung enthält Sensorwerte, die mit Datum und Uhrzeit gekennzeichnet sind. Die Sensorwerte sind vom Datentyp float. Beispieldaten: { "_cls" : …

5
pandas read_csv und filtern spalten mit usecols
Ich habe eine CSV-Datei, die nicht richtig eingeht, pandas.read_csvwenn ich die Spalten mit usecolsfiltere und mehrere Indizes verwende. import pandas as pd csv = r"""dummy,date,loc,x bar,20090101,a,1 bar,20090102,a,3 bar,20090103,a,5 bar,20090101,b,1 bar,20090102,b,3 bar,20090103,b,5""" f = open('foo.csv', 'w') f.write(csv) f.close() df1 = pd.read_csv('foo.csv', header=0, names=["dummy", "date", "loc", "x"], index_col=["date", "loc"], usecols=["dummy", "date", "loc", …


2
Wie wähle ich Zeilen mit NaN in einer bestimmten Spalte aus?
Wie kann man angesichts dieses Datenrahmens nur die Zeilen auswählen, deren "Col2" gleich ist NaN? In [56]: df = pd.DataFrame([range(3), [0, np.NaN, 0], [0, 0, np.NaN], range(3), range(3)], columns=["Col1", "Col2", "Col3"]) In [57]: df Out[57]: 0 1 2 0 0 1 2 1 0 NaN 0 2 0 0 NaN …
96 python  pandas 



3
Importieren Sie die Pandas-Datenrahmenspalte als Zeichenfolge nicht int
Ich möchte die folgende CSV als Zeichenfolge importieren, nicht als int64. Pandas read_csv konvertiert es automatisch in int64, aber ich brauche diese Spalte als Zeichenfolge. ID 00013007854817840016671868 00013007854817840016749251 00013007854817840016754630 00013007854817840016781876 00013007854817840017028824 00013007854817840017963235 00013007854817840018860166 df = read_csv('sample.csv') df.ID >> 0 -9223372036854775808 1 -9223372036854775808 2 -9223372036854775808 3 -9223372036854775808 4 -9223372036854775808 5 -9223372036854775808 …
95 python  pandas 

5
Pandas DataFrame anwenden lassen () alle Kerne verwenden?
Ab August 2017 ist Pandas DataFame.apply () leider immer noch auf die Arbeit mit einem einzelnen Kern beschränkt, was bedeutet, dass ein Multi-Core-Computer den größten Teil seiner Rechenzeit beim Ausführen verschwendet df.apply(myfunc, axis=1). Wie können Sie alle Ihre Kerne verwenden, um die Anwendung auf einem Datenrahmen parallel auszuführen?
95 pandas  dask 


5
Ersetzen Sie None durch NaN im Pandas-Datenrahmen
Ich habe Tisch x: website 0 http://www.google.com/ 1 http://www.yahoo.com 2 None Ich möchte Python None durch Pandas NaN ersetzen. Ich habe es versucht: x.replace(to_replace=None, value=np.nan) Aber ich habe: TypeError: 'regex' must be a string or a compiled regular expression or a list or dict of strings or regular expressions, you …

4
Was ist der Unterschied zwischen pandas.qcut und pandas.cut?
Die Dokumentation sagt: http://pandas.pydata.org/pandas-docs/dev/basics.html "Kontinuierliche Werte können mithilfe der Funktionen cut (Bins basierend auf Werten) und qcut (Bins basierend auf Stichprobenquantilen) diskretisiert werden." Klingt für mich sehr abstrakt ... Ich kann die Unterschiede im folgenden Beispiel sehen, aber was bedeutet qcut (Beispielquantil) tatsächlich? Wann würden Sie qcut versus cut verwenden? …
94 python  pandas 

5
Wie kann ich Zeilen beim Laden in der Pandas-Funktion read_csv filtern?
Wie kann ich filtern, welche Zeilen einer CSV mit Pandas in den Speicher geladen werden sollen? Dies scheint eine Option zu sein, die man finden sollte read_csv. Vermisse ich etwas Beispiel: Wir haben eine CSV mit einer Zeitstempelspalte und möchten nur die Zeilen laden, deren Zeitstempel größer als eine bestimmte …
94 python  pandas 

11
Finden Sie einen ganzzahligen Index von Zeilen mit NaN im Pandas-Datenrahmen
Ich habe einen Pandas DataFrame wie diesen: a b 2011-01-01 00:00:00 1.883381 -0.416629 2011-01-01 01:00:00 0.149948 -1.782170 2011-01-01 02:00:00 -0.407604 0.314168 2011-01-01 03:00:00 1.452354 NaN 2011-01-01 04:00:00 -1.224869 -0.947457 2011-01-01 05:00:00 0.498326 0.070416 2011-01-01 06:00:00 0.401665 NaN 2011-01-01 07:00:00 -0.019766 0.533641 2011-01-01 08:00:00 -1.101303 -1.408561 2011-01-01 09:00:00 1.671795 -0.764629 Gibt …
94 python  pandas 

5
Was ist der Unterschied zwischen NaN und None?
Ich lese zwei Spalten einer CSV-Datei mit Pandas readcsv()und weise die Werte dann einem Wörterbuch zu. Die Spalten enthalten Zeichenfolgen aus Zahlen und Buchstaben. Gelegentlich gibt es Fälle, in denen eine Zelle leer ist. Meiner Meinung nach sollte der Wert, der zu diesem Wörterbucheintrag gelesen wird, Noneaber stattdessen nanzugewiesen werden. …
94 python  numpy  pandas  nan 

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.