blank page detection nach dem scannen

Florian Lohoff flo at rfc822.org
Wed Apr 8 12:17:04 CEST 2009


Hi,
nachdem ich mit Sane und einen kleinen selbstgebastelten daemon meinen scanner
am laufen habe d.h. auf knopdruck das gesamte dokument mit scanadf durchgezogen
und in ein PDF gewandelt wird habe ich nun das problem das ich gerne leere
seiten eliminieren wuerde. Der scanner kann duplex scannen und je nach function
macht der das auch - nur ist oftmals der letzte ruecken oder so leer und den
wuerde ich gerne im resultierenden pdf eliminieren. Derzeitiger workflow:

Nach dem erfolgreichen scan wird dieses script aufgerufen was dann
die scans erst mit unpaper nen bischen aufraeumt und dann mit tiff2cp und tiff2pdf
in ein pdf wandelt:

	TMPDIR=$1

	unpaper=/usr/bin/unpaper
	pnmtotiff=/usr/bin/pnmtotiff
	tiffcp=/usr/bin/tiffcp
	tiff2pdf=/usr/bin/tiff2pdf

	set -x

	OUTPUT=~/Desktop/scan-`date +%Y%m%d%H%M%S`.pdf

	${unpaper} -v --layout none ${TMPDIR}/scan-%d.pnm ${TMPDIR}/unpaper-%d.pnm

	for file in ${TMPDIR}/unpaper*; do
		${pnmtotiff} $file >$file.tiff
	done

	${tiffcp} ${TMPDIR}/*.tiff ${TMPDIR}/allpages.tiff

	${tiff2pdf} -z -o ${OUTPUT} ${TMPDIR}/allpages.tiff 


Der naechste schritt waere noch via tesseract ein OCR und das
als comment ans PDF haengen - aber das beim naechsten mal.

Jetzt erstmal - Wie werde ich "leere" seiten los?

Flo
-- 
Florian Lohoff                  flo at rfc822.org             +49-171-2280134
	Those who would give up a little freedom to get a little 
          security shall soon have neither - Benjamin Franklin
-------------- next part --------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 189 bytes
Desc: Digital signature
URL: <http://lug-owl.de/pipermail/linux/attachments/20090408/a8e60d50/attachment.sig>


More information about the Linux mailing list