Als «dataframe» getaggte Fragen

Ein Datenrahmen ist eine tabellarische Datenstruktur. Normalerweise enthält es Daten, bei denen Zeilen Beobachtungen und Spalten Variablen verschiedener Typen sind. Während "Datenrahmen" oder "Datenrahmen" der Begriff ist, der für dieses Konzept in mehreren Sprachen verwendet wird (R, Apache Spark, deedle, Maple, die Pandas-Bibliothek in Python und die DataFrames-Bibliothek in Julia), ist "Tabelle" der Begriff, der in verwendet wird MATLAB und SQL.




8
Mehrere Variablen pro Gruppe aggregieren / zusammenfassen (z. B. Summe, Mittelwert)
Von einem Datenrahmen, gibt es eine einfache Möglichkeit , aggregieren ( sum, mean, maxet c) gleichzeitig mehrere Variablen? Nachfolgend einige Beispieldaten: library(lubridate) days = 365*2 date = seq(as.Date("2000-01-01"), length = days, by = "day") year = year(date) month = month(date) x1 = cumsum(rnorm(days, 0.05)) x2 = cumsum(rnorm(days, 0.05)) df1 = …



3
Logische Operatoren für die boolesche Indizierung in Pandas
Ich arbeite mit dem booleschen Index in Pandas. Die Frage ist, warum die Aussage: a[(a['some_column']==some_number) & (a['some_other_column']==some_other_number)] funktioniert gut während a[(a['some_column']==some_number) and (a['some_other_column']==some_other_number)] Exits mit Fehler? Beispiel: a=pd.DataFrame({'x':[1,1],'y':[10,20]}) In: a[(a['x']==1)&(a['y']==10)] Out: x y 0 1 10 In: a[(a['x']==1) and (a['y']==10)] Out: ValueError: The truth value of an array with more …

3
Pandas erstellen einen leeren DataFrame mit nur Spaltennamen
Ich habe einen dynamischen DataFrame, der einwandfrei funktioniert, aber wenn dem DataFrame keine Daten hinzugefügt werden müssen, wird eine Fehlermeldung angezeigt. Und deshalb brauche ich eine Lösung, um einen leeren DataFrame nur mit den Spaltennamen zu erstellen. Im Moment habe ich so etwas: df = pd.DataFrame(columns=COLUMN_NAMES) # Note that there …
151 python  pandas  dataframe 



8
Können Pandas Daten automatisch erkennen?
Heute war ich positiv überrascht, dass Pandas beim Lesen von Daten aus einer Datendatei (zum Beispiel) Wertetypen erkennen kann: df = pandas.read_csv('test.dat', delimiter=r"\s+", names=['col1','col2','col3']) Zum Beispiel kann es folgendermaßen überprüft werden: for i, r in df.iterrows(): print type(r['col1']), type(r['col2']), type(r['col3']) Insbesondere Ganzzahlen, Gleitkommazahlen und Zeichenfolgen wurden korrekt erkannt. Ich habe …
150 python  date  types  dataframe  pandas 

12
Ersetzen von Leerwerten (Leerzeichen) durch NaN in Pandas
Ich möchte alle Werte in einem Pandas-Datenrahmen finden, die Leerzeichen (eine beliebige Menge) enthalten, und diese Werte durch NaNs ersetzen. Irgendwelche Ideen, wie dies verbessert werden kann? Grundsätzlich möchte ich das umdrehen: A B C 2000-01-01 -0.532681 foo 0 2000-01-02 1.490752 bar 1 2000-01-03 -1.387326 foo 2 2000-01-04 0.814772 baz …
150 python  pandas  dataframe 


7
Konvertieren Sie Zeilennamen in die erste Spalte
Ich habe einen Datenrahmen wie diesen: df VALUE ABS_CALL DETECTION P-VALUE 1007_s_at "957.729231881542" "P" "0.00486279317241156" 1053_at "320.632701283368" "P" "0.0313356324173416" 117_at "429.842323161046" "P" "0.0170004527476119" 121_at "2395.7364289242" "P" "0.0114473584876183" 1255_g_at "116.493632746934" "A" "0.39799368200131" 1294_at "739.927122116896" "A" "0.0668649772942343" Ich möchte die Zeilennamen in die erste Spalte konvertieren. Derzeit verwende ich so etwas, um …
146 r  dataframe  col  rowname 


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.