Als «dataframe» getaggte Fragen

Ein Datenrahmen ist eine tabellarische Datenstruktur. Normalerweise enthält es Daten, bei denen Zeilen Beobachtungen und Spalten Variablen verschiedener Typen sind. Während "Datenrahmen" oder "Datenrahmen" der Begriff ist, der für dieses Konzept in mehreren Sprachen verwendet wird (R, Apache Spark, deedle, Maple, die Pandas-Bibliothek in Python und die DataFrames-Bibliothek in Julia), ist "Tabelle" der Begriff, der in verwendet wird MATLAB und SQL.

15
Das Konstruieren von Pandas DataFrame aus Werten in Variablen ergibt "ValueError: Wenn Sie alle Skalarwerte verwenden, müssen Sie einen Index übergeben".
Dies mag eine einfache Frage sein, aber ich kann nicht herausfinden, wie das geht. Nehmen wir an, ich habe zwei Variablen wie folgt. a = 2 b = 3 Ich möchte daraus einen DataFrame erstellen: df2 = pd.DataFrame({'A':a,'B':b}) Dies erzeugt einen Fehler: ValueError: Wenn Sie alle Skalarwerte verwenden, müssen Sie …

6
Der Wahrheitswert einer Serie ist nicht eindeutig. Verwenden Sie a.empty, a.bool (), a.item (), a.any () oder a.all ()
Probleme beim Filtern meines Ergebnisdatenrahmens mit einer orBedingung. Ich möchte, dass mein Ergebnis dfalle Spaltenwerte extrahiert var, die über 0,25 und unter -0,25 liegen. Diese Logik gibt mir einen mehrdeutigen Wahrheitswert, funktioniert jedoch, wenn ich diese Filterung in zwei separate Operationen aufteile. Was passiert hier? Ich bin mir nicht sicher, …

12
So wenden Sie eine Funktion auf zwei Spalten des Pandas-Datenrahmens an
Angenommen, ich habe eine, dfdie Spalten von hat 'ID', 'col_1', 'col_2'. Und ich definiere eine Funktion: f = lambda x, y : my_function_expression. Jetzt möchte ich die beiden Spalten von to anwenden f, um eine neue Spalte elementweise zu berechnen , ähnlich wie:df'col_1', 'col_2''col_3' df['col_3'] = df[['col_1','col_2']].apply(f) # Pandas gives …
368 python  pandas  dataframe 

10
Extrahieren bestimmter Spalten aus einem Datenrahmen
Ich habe einen R-Datenrahmen mit 6 Spalten und möchte einen neuen Datenrahmen erstellen, der nur drei der Spalten enthält. Unter der Annahme , meinen Datenrahmen ist df, und ich mag Extrakt Spalten A, Bund Edies ist die einzige Befehl kann ich herausfinden: data.frame(df$A,df$B,df$E) Gibt es eine kompaktere Möglichkeit, dies zu …
365 r  dataframe  r-faq 

15
So summieren Sie eine Variable nach Gruppe
Ich habe einen Datenrahmen mit zwei Spalten. Die erste Spalte enthält Kategorien wie "Erste", "Zweite", "Dritte", und die zweite Spalte enthält Zahlen, die angeben, wie oft ich die spezifischen Gruppen aus "Kategorie" gesehen habe. Zum Beispiel: Category Frequency First 10 First 15 First 5 Second 2 Third 14 Third 20 …
357 r  dataframe  aggregate  r-faq 

17
Konvertieren Sie data.frame-Spalten von Faktoren in Zeichen
Ich habe einen Datenrahmen. Nennen wir ihn bob: > head(bob) phenotype exclusion GSM399350 3- 4- 8- 25- 44+ 11b- 11c- 19- NK1.1- Gr1- TER119- GSM399351 3- 4- 8- 25- 44+ 11b- 11c- 19- NK1.1- Gr1- TER119- GSM399352 3- 4- 8- 25- 44+ 11b- 11c- 19- NK1.1- Gr1- TER119- GSM399353 3- …
352 r  dataframe 

11
Wie erhalte ich einen Wert aus einer Zelle eines Datenrahmens?
Ich habe eine Bedingung erstellt, die genau eine Zeile aus meinem Datenrahmen extrahiert: d2 = df[(df['l_ext']==l_ext) & (df['item']==item) & (df['wn']==wn) & (df['wd']==1)] Jetzt möchte ich einen Wert aus einer bestimmten Spalte entnehmen: val = d2['col_name'] Als Ergebnis erhalte ich jedoch einen Datenrahmen, der eine Zeile und eine Spalte enthält ( …
344 python  pandas  dataframe 

9
Konvertieren Sie eine Liste von Datenrahmen in einen Datenrahmen
Ich habe Code, der an einer Stelle mit einer Liste von Datenrahmen endet, die ich wirklich in einen einzelnen großen Datenrahmen konvertieren möchte. Ich habe einige Hinweise von einer früheren Frage erhalten, die versucht hat, etwas Ähnliches, aber Komplexeres zu tun. Hier ist ein Beispiel dafür, womit ich beginne (dies …
336 list  r  dataframe 


14
pandas: Filterzeilen von DataFrame mit Operatorverkettung
Die meisten Operationen in pandaskann mit Operator Verkettung erreicht werden ( groupby, aggregate, apply, usw.), aber der einzige Weg , ich Filterreihen gefunden habe , ist über normale Klammer Indizierung df_filtered = df[df['column'] == value] Dies ist unattraktiv, da ich dfeine Variable zuweisen muss , bevor ich nach ihren Werten …
329 python  pandas  dataframe 



7
Pandas read_csv low_memory und dtype Optionen
Beim Anruf df = pd.read_csv('somefile.csv') Ich bekomme: /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130: DtypeWarning: Spalten (4,5,7,16) haben gemischte Typen. Geben Sie beim Import die Option dtype an oder setzen Sie low_memory = False. Warum hängt die dtypeOption zusammen low_memoryund warum Falsehilft sie bei diesem Problem?

11
So speichern Sie einen Datenrahmen mit Pandas
Im Moment importiere CSVich jedes Mal, wenn ich das Skript ausführe , einen ziemlich großen Datenrahmen. Gibt es eine gute Lösung, um diesen Datenrahmen zwischen den Läufen ständig verfügbar zu halten, damit ich nicht die ganze Zeit auf die Ausführung des Skripts warten muss?
317 python  pandas  dataframe 


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.