Wie dekomprimiere ich eine ZIM-Datei?


0

Ich habe ein ZIM Datei und möchte sich den Inhalt ansehen. Zählen Sie insbesondere die Anzahl der Artikel und Bilder und durchsuchen Sie möglicherweise Bilder.

Wie geht das? Vorzugsweise unter Linux, aber Anweisungen für andere Systeme sind ebenfalls in Ordnung.

Ich möchte keine Bilder zählen, indem ich das ZIM in Kiwix öffne und alle tausend Seiten durchblättere und manuell zähle.

Es ist weder von XZ noch von ZIP unkomprimierbar:

$ unxz wikivoyage_en_all_2015-09.zim
unxz: wikivoyage_en_all_2015-09.zim: File format not recognized

$ zipinfo wikivoyage_en_all_2015-09.zim
Archive:  wikivoyage_en_all_2015-09.zim
[wikivoyage_en_all_2015-09.zim]
  End-of-central-directory signature not found.  Either this file is not
  a zipfile, or it constitutes one disk of a multi-part archive.  In the
  latter case the central directory and zipfile comment will be found on
  the last disk(s) of this archive.
zipinfo:  cannot find zipfile directory in one of wikivoyage_en_all_2015-09.zim or
          wikivoyage_en_all_2015-09.zim.zip, and cannot find wikivoyage_en_all_2015-09.zim.ZIP, period.

Ihr Link sagt: "Das Format erlaubt die Komprimierung von Artikeln mit LZMA2, wie von der xz-utils-Bibliothek implementiert". Hast du es probiert? unxz <file>?
ap0

@ ap0: Ja ich habe es versucht, heißt es unxz: wikivoyage_en_all_2015-09.zim: File format not recognized.
Nicolas Raoul

Antworten:


1

Der einfachste Weg ist die Verwendung der zimdump Befehl, Teil von Zimlib .

Beispielausgabe:

zimdump -F wikivoyage_en_all_2015-09.zim
count-articles: 84897
uuid: 9213375a-53f4-819c-47ed-41fc87e7028f
article count: 84897
mime list pos: 80
url ptr pos: 193
title idx pos: 679369
cluster count: 40711
cluster ptr pos: 5169080
checksum pos: 468245393
checksum: 05b9bbf3b6d0c955b6ee74a3f929d911
main page: 44192
layout page: -

Nicht sicher, was diese bedeuten, aber zumindest die Anzahl der Artikel ist verfügbar.

Das -D Die Option speichert alles in einem Verzeichnis.

zimdump -D name_of_dir file.zim

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.