Pandas DataFrame zur Liste der Wörterbücher


165

Ich habe den folgenden DataFrame:

Kundenartikel1 Artikel2 Artikel3
1 Apfelmilchtomate
2 Wasserorangenkartoffel
3 Saft Mango Chips

was ich es in eine Liste von Wörterbüchern pro Zeile übersetzen möchte

rows = [{'customer': 1, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'},
    {'customer': 2, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
    {'customer': 3, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}]

2
Willkommen bei Stack Overflow! Ich habe Ihr Codebeispiel um 4 Leerzeichen eingerückt, damit es richtig gerendert wird. Weitere Informationen zur Formatierung finden Sie in der Bearbeitungshilfe.
ByteHamster

Antworten:


189

Bearbeiten

Wie John Galt in seiner Antwort erwähnt , sollten Sie wahrscheinlich stattdessen verwenden df.to_dict('records'). Es ist schneller als manuell zu transponieren.

In [20]: timeit df.T.to_dict().values()
1000 loops, best of 3: 395 µs per loop

In [21]: timeit df.to_dict('records')
10000 loops, best of 3: 53 µs per loop

Ursprüngliche Antwort

Verwenden Sie df.T.to_dict().values()wie unten:

In [1]: df
Out[1]:
   customer  item1   item2   item3
0         1  apple    milk  tomato
1         2  water  orange  potato
2         3  juice   mango   chips

In [2]: df.T.to_dict().values()
Out[2]:
[{'customer': 1.0, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'},
 {'customer': 2.0, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
 {'customer': 3.0, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}]

2
Was wäre die Lösung bei einem Datenrahmen, der für jeden Kunden viele Zeilen enthält?
Aziz

2
Wenn ich benutze df.T.to_dict().values(), verliere ich auch die Sortierreihenfolge
Hussain

Wenn ich eine CSV-Datei öffne, um eine Liste von unicodecsv.DictReader
Diktaten zu erstellen, erhalte

219

Verwendung df.to_dict('records')- gibt die Ausgabe aus, ohne extern transponieren zu müssen.

In [2]: df.to_dict('records')
Out[2]:
[{'customer': 1L, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'},
 {'customer': 2L, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
 {'customer': 3L, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}]

2
Wie würde ich es ändern, um den Indexwert in jeden Eintrag der resultierenden Liste aufzunehmen?
Gabriel L. Oliveira

5
@ GabrielL.Oliveira Sie können df.reset_index (). To_dict ('Aufzeichnungen')
Wei Ma

Ist die Reihenfolge der jeweils reservierten Spalten dh ist der n-te Eintrag in der resultierenden Liste immer auch die n-te Spalte?
Cleb

@Cleb sind i.e. is the nth entry in the resulting list always also the nth column?n-te Spalte oder n-te Zeile?
Nauman Naeem

14

Als Erweiterung von John Galts Antwort -

Für den folgenden DataFrame:

   customer  item1   item2   item3
0         1  apple    milk  tomato
1         2  water  orange  potato
2         3  juice   mango   chips

Wenn Sie eine Liste der Wörterbücher einschließlich der Indexwerte erhalten möchten, können Sie Folgendes tun:

df.to_dict('index')

Hiermit wird ein Wörterbuch mit Wörterbüchern ausgegeben, wobei die Schlüssel des übergeordneten Wörterbuchs Indexwerte sind. In diesem speziellen Fall

{0: {'customer': 1, 'item1': 'apple', 'item2': 'milk', 'item3': 'tomato'},
 1: {'customer': 2, 'item1': 'water', 'item2': 'orange', 'item3': 'potato'},
 2: {'customer': 3, 'item1': 'juice', 'item2': 'mango', 'item3': 'chips'}}

1

Wenn Sie nur eine Spalte auswählen möchten, funktioniert dies.

df[["item1"]].to_dict("records")

Das Folgende funktioniert NICHT und erzeugt einen TypeError: nicht unterstützten Typ :. Ich glaube, das liegt daran, dass versucht wird, eine Serie in ein Diktat und keinen Datenrahmen in ein Diktat umzuwandeln.

df["item1"].to_dict("records")

Ich musste nur eine Spalte auswählen und in eine Liste von Diktaten mit dem Spaltennamen als Schlüssel konvertieren.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.