Adobe Acrobat (nicht zu verwechseln mit dem kostenfreien Reader!) kann das. Das eingescannte Dokument (Pixelgrafik) wird dann im Hintergrund (unsichtbar) mit dem OCR Resultat hinterlegt. Werden einzelne Abschnitte nicht 100%ig erkannt ist dies somit auch kein Problem, denn der Anwender sieht ohnehin die im Vordergrund liegende Grafik - markiert man einen Text wird jedoch automatisch das dahinter verborgene OCR Resultat in die Zwischenablage kopiert. In solchen Dokumenten kann man dann auch Suchen, sie indizieren etc...
Einziger Nachteil: Acrobat ist halt doch recht teuer.
Aber vielleicht bekommst ja eine gebrauchte 6er Version, die konnte das auch schon und ist mittlerweile doch in die Jahre gekommen, sollte also günstiger zu haben sein.
|