Als «pandas» getaggte Fragen

Pandas ist eine Python-Bibliothek zur Datenmanipulation und -analyse, z. B. Datenrahmen, mehrdimensionale Zeitreihen und Querschnittsdatensätze, die häufig in Statistiken, experimentellen wissenschaftlichen Ergebnissen, Ökonometrie oder Finanzen verwendet werden. Pandas ist eine der wichtigsten Data Science-Bibliotheken in Python.

6
Überprüfen Sie, ob ein Wert im Pandas-Datenrahmenindex vorhanden ist
Ich bin mir sicher, dass es einen offensichtlichen Weg gibt, dies zu tun, aber ich kann mir momentan nichts Besonderes vorstellen. Grundsätzlich statt Ausnahme der Anhebung Ich mag bekommen Trueoder Falsezu sehen , ob ein Wert in Pandas existiert dfIndex. import pandas as pd df = pd.DataFrame({'test':[1,2,3,4]}, index=['a','b','c','d']) df.loc['g'] # …
139 python  pandas  ipython 

6
Pandas read_csv von der URL
Ich verwende Python 3.4 mit IPython und habe den folgenden Code. Ich kann keine CSV-Datei von der angegebenen URL lesen: import pandas as pd import requests url="https://github.com/cs109/2014_data/blob/master/countries.csv" s=requests.get(url).content c=pd.read_csv(s) Ich habe den folgenden Fehler "Erwarteter Dateipfadname oder dateiähnliches Objekt, Typ erhalten" Wie kann ich das beheben?
138 python  csv  pandas  request 

6
Pandas: Einstellung Nr. von max Zeilen
Ich habe ein Problem beim Anzeigen von Folgendem DataFrame: n = 100 foo = DataFrame(index=range(n)) foo['floats'] = np.random.randn(n) foo Das Problem ist, dass nicht alle Zeilen standardmäßig in ipython notebook gedruckt werden, aber ich muss schneiden, um die resultierenden Zeilen anzuzeigen. Auch die folgende Option ändert die Ausgabe nicht: pd.set_option('display.max_rows', …

7
Suchen Sie eine Spalte, deren Name eine bestimmte Zeichenfolge enthält
Ich habe einen Datenrahmen mit Spaltennamen und möchte den finden, der eine bestimmte Zeichenfolge enthält, aber nicht genau mit dieser übereinstimmt. Ich suche 'spike'in Spaltennamen wie 'spike-2', 'hey spike', 'spiked-in'(der 'spike'Teil immer stetig ist). Ich möchte, dass der Spaltenname als Zeichenfolge oder Variable zurückgegeben wird, damit ich später mit df['name']oder …

5
Pandas Datenrahmen erhalten die erste Zeile jeder Gruppe
Ich habe einen Pandas DataFramewie folgt. df = pd.DataFrame({'id' : [1,1,1,2,2,3,3,3,3,4,4,5,6,6,6,7,7], 'value' : ["first","second","second","first", "second","first","third","fourth", "fifth","second","fifth","first", "first","second","third","fourth","fifth"]}) Ich möchte dies nach ["id", "value"] gruppieren und die erste Zeile jeder Gruppe erhalten. id value 0 1 first 1 1 second 2 1 second 3 2 first 4 2 second 5 3 …
137 python  pandas  dataframe 

6
Pandas Dataframe-Spalten, die mit sklearn skaliert werden
Ich habe einen Pandas-Datenrahmen mit gemischten Spalten und möchte den min_max_scaler von sklearn auf einige der Spalten anwenden. Im Idealfall würde ich diese Transformationen gerne an Ort und Stelle durchführen, habe aber noch keinen Weg gefunden, dies zu tun. Ich habe den folgenden Code geschrieben, der funktioniert: import pandas as …


7
Pandas teilen die Listenspalte in mehrere Spalten auf
Ich habe einen Pandas DataFrame mit einer Spalte: import pandas as pd df = pd.DataFrame( data={ "teams": [ ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ] } ) print(df) Ausgabe: teams 0 [SF, NYG] 1 [SF, NYG] 2 [SF, NYG] 3 [SF, NYG] …
136 python  pandas 

6
pandas: Wie teile ich Text in einer Spalte in mehrere Zeilen auf?
Ich arbeite mit einer großen CSV-Datei und die vorletzte Spalte enthält eine Textzeichenfolge, die ich durch ein bestimmtes Trennzeichen teilen möchte. Ich habe mich gefragt, ob es einen einfachen Weg gibt, dies mit Pandas oder Python zu tun. CustNum CustomerName ItemQty Item Seatblocks ItemExt 32363 McCartney, Paul 3 F04 2:218:10:4,6 …
135 python  pandas  dataframe 


6
Wie lade ich eine tsv-Datei in einen Pandas DataFrame?
Ich bin neu in Python und Pandas. Ich versuche, eine tsvDatei in einen Pandas zu laden DataFrame. Dies ist, was ich versuche und der Fehler, den ich bekomme: >>> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t')) Traceback (most recent call last): File "<pyshell#28>", line 1, in <module> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t')) File "C:\Python27\lib\site-packages\pandas\core\frame.py", …
135 python  pandas  csv 

8
Pandas eindeutige Werte mehrere Spalten
df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)}) Was ist der beste Weg, um die eindeutigen Werte von 'Col1' und 'Col2' zurückzugeben? Die gewünschte Ausgabe ist 'Bob', 'Joe', 'Bill', 'Mary', 'Steve'

9
ImportError: Kein Modul mit dem Namen dateutil.parser
Beim Importieren pandasin ein PythonProgramm wird folgende Fehlermeldung angezeigt monas-mbp:book mona$ sudo pip install python-dateutil Requirement already satisfied (use --upgrade to upgrade): python-dateutil in /System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python Cleaning up... monas-mbp:book mona$ python t1.py No module named dateutil.parser Traceback (most recent call last): File "t1.py", line 4, in <module> import pandas as pd …
134 python  pandas  pip 

4
Python-Pandas: Füllen Sie einen Datenrahmen Zeile für Zeile
Die einfache Aufgabe, einem pandas.DataFrameObjekt eine Zeile hinzuzufügen, scheint schwer zu erfüllen zu sein. Es gibt 3 Fragen zum Stapelüberlauf, von denen keine eine funktionierende Antwort gibt. Folgendes versuche ich zu tun. Ich habe einen DataFrame, dessen Form ich bereits kenne, sowie die Namen der Zeilen und Spalten. >>> df …
133 python  dataframe  row  pandas 


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.