Allgemein
Ihre pkl
Datei ist in der Tat eine serialisierte pickle
Datei, was bedeutet, dass sie mit dem Python- pickle
Modul gesichert wurde.
So entfernen Sie die Daten:
import pickle
with open('serialized.pkl', 'rb') as f:
data = pickle.load(f)
Für den MNIST-Datensatz
Hinweis gzip
wird nur benötigt, wenn die Datei komprimiert ist:
import gzip
import pickle
with gzip.open('mnist.pkl.gz', 'rb') as f:
train_set, valid_set, test_set = pickle.load(f)
Wo jeder Satz weiter unterteilt werden kann (dh für den Trainingssatz):
train_x, train_y = train_set
Dies sind die Eingaben (Ziffern) und Ausgaben (Beschriftungen) Ihrer Sets.
Wenn Sie die Ziffern anzeigen möchten:
import matplotlib.cm as cm
import matplotlib.pyplot as plt
plt.imshow(train_x[0].reshape((28, 28)), cmap=cm.Greys_r)
plt.show()
Die andere Alternative wäre, sich die Originaldaten anzusehen:
http://yann.lecun.com/exdb/mnist/
Dies wird jedoch schwieriger, da Sie ein Programm zum Lesen der Binärdaten in diesen Dateien erstellen müssen. Daher empfehle ich Ihnen, Python zu verwenden und die Daten mit zu laden pickle
. Wie Sie gesehen haben, ist es sehr einfach. ;-);