Ich verwende scanimage
einen Dokumentenscanner (Canon DR-2510C), der Duplex-Scannen unterstützt. Leider unterstützt der SANE-Treiber die Erkennung leerer Seiten nicht, sodass leere Seiten bei gemischten Seiten (einseitig / doppelseitig) in das Scan-Ergebnis gelangen.
Ich möchte diese leeren Seiten bei der Nachbearbeitung der Scanausgabe automatisch entfernen, daher suche ich nach einem Befehlszeilentool, das erkennen kann, ob eine TIFF- oder PNM-Datei hauptsächlich aus weißen Pixeln besteht.
Irgendwelche Ideen?
Dies ist die Lösung, die ich basierend auf der Antwort von Lesmana gefunden habe:
for i in "${DEST_DIR}/out"*.pnm; do
histogram=`convert "${i}" -threshold 50% -format %c histogram:info:-`
white=`echo "${histogram}" | grep "white" | sed -n 's/^ *\(.*\):.*$/\1/p'`
black=`echo "${histogram}" | grep "black" | sed -n 's/^ *\(.*\):.*$/\1/p'`
blank=`echo "scale=4; ${black}/${white} < 0.005" | bc`
if [ ${blank} -eq "1" ]; then
echo "${i} seems to be blank - removing it..."
rm "${i}"
fi
done