OCR-Ergebnis mit in ein PDF packen (was: blank page detection nach dem scannen)
Jan-Benedict Glaw
jbglaw at lug-owl.de
Wed Apr 15 18:43:04 CEST 2009
On Wed, 2009-04-15 17:53:20 +0200, Johannes Goecke <goecke at upb.de> wrote:
> On Wed, Apr 15, 2009 at 01:43:19PM +0200, Jan-Benedict Glaw wrote:
> >
> > Beim Stichwort "OCR"...
> >
> ...
> > Was ich nun aber suche: Ist es möglich, den OCRten Text irgendwie in
> > die PDFs zu packen? Und optimalerweise so, daß der via der
> > Such-Funktionen in den PDF-Betrachtern dann auch den einzelnen Seiten
> > (also gescannten Bildern dieser) zugeordnet werden kann?
>
> Ich habe es letztens gelesen ich meine im Linux-Magazin, finde
> es aber nicht auf den Webseiten (vielleicht finde ich die Zeitung
> nochmal - war nicht meine).
>
> Aber schau dir mal die "archivista-box" ( www.archivista.ch ) an.
> Die tun sowas unter Linux und man kanns dowloaden und anschauen.
Ah, das ist 'nen Tip, der vielleicht Gold wert gewesen ist. Nach 'nem
bissl Klicken landet man hier:
http://www.exactcode.de/site/open_source/exactimage/hocr2pdf/
Das sieht schon sehr danach aus, was ich suche.
Danke!
MfG, JBG
--
Jan-Benedict Glaw jbglaw at lug-owl.de +49-172-7608481
Signature of: If it doesn't work, force it.
the second : If it breaks, it needed replacing anyway.
-------------- next part --------------
A non-text attachment was scrubbed...
Name: signature.asc
Type: application/pgp-signature
Size: 197 bytes
Desc: Digital signature
URL: <http://lug-owl.de/pipermail/linux/attachments/20090415/8c2c5128/attachment.sig>
More information about the Linux
mailing list