Warum kann ich eine .bz2-Datei nicht mit tar dekomprimieren?


30

Also habe ich diesen Wikipedia-Dump mit einer Größe von ungefähr 10 GB und dem Namen "enwiki-latest-pages-articles.xml.bz2". Ich habe die folgenden Befehle im Terminal versucht, um den Speicherauszug zu entpacken:

tar jxf enwiki-latest-pages-articles.xml.bz2

Und

tar xvf enwiki-latest-pages-articles.xml.bz2

Beide geben jedoch den folgenden Fehler zurück

tar: This does not look like a tar archive
tar: Skipping to next header

1
Führen Sie den folgenden Befehl aus und fügen Sie die Ausgabe "file enwiki-latest-pages-articles.xml.bz2"
PKumar

Dieses Q / A kann helfen, nutzen Sie 7zutil zum Extrahieren von allem
c0rp

2
Ich stelle fest, dass Sie sagen, dass dies eine riesige Datei ist. Eine weitere Möglichkeit besteht darin, sie in etwas zu leiten: bzcat enwiki-latest-pages-articles.xml.bz2 | someotherprogram
nwaltham

@nwaltham: Du hättest mein Votum, wenn du das beantwortet hättest.
Ilmari Karonen

Weil tar tar-Dateien extrahiert und es keine tar-Datei ist?
user253751

Antworten:


71

Sie können den tarBefehl nicht verwenden, da das Archiv keine .tar. * -Datei ist. Verwenden Sie den folgenden Befehl, um eine bzip2-Datei zu dekomprimieren (dabei wird die ursprüngliche .bz2-Datei nicht beibehalten):

bzip2 -d enwiki-latest-pages-articles.xml.bz2

Wenn Sie es extrahieren und das Original behalten möchten, führen Sie den folgenden Befehl aus:

bzip2 -dk enwiki-latest-pages-articles.xml.bz2

Quelle: https://superuser.com/questions/480950/how-to-decompress-a-bz2-file


3
Oder benutze bunzip2.
user253751

@immibis So oder so funktioniert. :)
Terrance8D

21

Verwenden Sie einfach bunzip2:

bunzip2 enwiki-latest-pages-articles.xml.bz2

Und wenn es eine gzipkomprimierte Datei ist:

gunzip enwiki-latest-pages-articles.xml.gz
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.