blank page detection nach dem scannen
Florian Lohoff
flo at rfc822.org
Wed Apr 8 12:17:04 CEST 2009
Hi,
nachdem ich mit Sane und einen kleinen selbstgebastelten daemon meinen scanner
am laufen habe d.h. auf knopdruck das gesamte dokument mit scanadf durchgezogen
und in ein PDF gewandelt wird habe ich nun das problem das ich gerne leere
seiten eliminieren wuerde. Der scanner kann duplex scannen und je nach function
macht der das auch - nur ist oftmals der letzte ruecken oder so leer und den
wuerde ich gerne im resultierenden pdf eliminieren. Derzeitiger workflow:
Nach dem erfolgreichen scan wird dieses script aufgerufen was dann
die scans erst mit unpaper nen bischen aufraeumt und dann mit tiff2cp und tiff2pdf
in ein pdf wandelt:
TMPDIR=$1
unpaper=/usr/bin/unpaper
pnmtotiff=/usr/bin/pnmtotiff
tiffcp=/usr/bin/tiffcp
tiff2pdf=/usr/bin/tiff2pdf
set -x
OUTPUT=~/Desktop/scan-`date +%Y%m%d%H%M%S`.pdf
${unpaper} -v --layout none ${TMPDIR}/scan-%d.pnm ${TMPDIR}/unpaper-%d.pnm
for file in ${TMPDIR}/unpaper*; do
${pnmtotiff} $file >$file.tiff
done
${tiffcp} ${TMPDIR}/*.tiff ${TMPDIR}/allpages.tiff
${tiff2pdf} -z -o ${OUTPUT} ${TMPDIR}/allpages.tiff
Der naechste schritt waere noch via tesseract ein OCR und das
als comment ans PDF haengen - aber das beim naechsten mal.
Jetzt erstmal - Wie werde ich "leere" seiten los?
Flo
--
Florian Lohoff flo at rfc822.org +49-171-2280134
Those who would give up a little freedom to get a little
security shall soon have neither - Benjamin Franklin
-------------- next part --------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 189 bytes
Desc: Digital signature
URL: <http://lug-owl.de/pipermail/linux/attachments/20090408/a8e60d50/attachment.sig>
More information about the Linux
mailing list