WCM Forum

WCM Forum (http://www.wcm.at/forum/index.php)
-   Software (http://www.wcm.at/forum/forumdisplay.php?f=5)
-   -   ocr + pdf ? (http://www.wcm.at/forum/showthread.php?t=195597)

mr.red 19.07.2006 22:04

ocr + pdf ?
 
hy, wenn ich ein ocr programm mit pdf ausgabe hab krieg ich dann ein pdf in dem ich text markieren kann oder krieg ich eins in dem ich entweder den scan oder den erkannten text anzeigen lassen kann?
welches proggie taugt denn für automatische scans von a4 briefen ?

Schappenberg 20.07.2006 08:40

Zitat:

hy, wenn ich ein ocr programm mit pdf ausgabe hab krieg ich dann ein pdf in dem ich text markieren kann oder krieg ich eins in dem ich entweder den scan oder den erkannten text anzeigen lassen kann?
Wenn das PDF direkt vom Programmm erzeugt wird (nicht über Umweg durch drucken des Dokuments) sollte eigentlich ein PDF mit markier/durchsuchbarem Text erzeugt werden.

row 20.07.2006 09:46

Gewöhnlich ist das vom OCR-Proggi erstellte PDF Text durchsuchbar/markierbar wenn das Programm Text auch als Text erkennt.

Probleme können nur schlecht lesbare Texte (kleine Schrift, Schrift über Bilder, ...) bereiten, weil hier die OCR manchmal nichts erkennt und daher das nicht-erkannte Objekt als Grafik in den Text reinsetzt. Bei ReadIris kannst dann auch vor dem Erstellen des PDFs Objekte aus der Erkennung ausschliessen (z.B. Flecken, von denen er glaubt dass sei Text).

Wobei wenn Du A4-Briefe einscannst (ich nehme an Geschäftskorrespondenz), dürften die oben beschriebenen Dinge eher selten auftreten und die Erkennung einigermassen funktionieren.

mr.red 20.07.2006 10:32

thx! ist das bei "bild im text" auch so, dass man im bild markiert und der text in die zwischenablage kopiert wird?

row 20.07.2006 11:05

Was verstehst Du denn unter "bild im text", ein Bild wo Text drüber gelegt ist?

mr.red 20.07.2006 12:03

weiß ich eben nicht, hab das wo gelesen und aus dem text ging nicht hervor ob dieses feature bedeutet, dass der text mit der grafik direkt gekoppelt is oder angefügt

Schappenberg 20.07.2006 12:24

Ich schätz mal das heißt, dass du im PDF-Dokument das gescannte Bild siehst, im Hintergrund aber der markierbare Text liegt.
Im Extremfall sieht man eine Handgeschriebene Notiz wo man den OCR gescannten Text aber trotzdem markieren und kopieren kann.

mr.red 20.07.2006 16:10

jo, hab jetzt die trial von fine reader, tatsache es is so, ziemlich gut

row 21.07.2006 09:56

Stimmt, diese Funktion gibt's auch noch, nur funktioniert das bei meiner (alten) ReadIris-Version 7.0 nur sehr schlecht. Haben die neueren Versionen das schon besser im Griff?

mr.red 21.07.2006 19:59

ich hab 4 dokus probiert und das funkt 1a. durcheinander kommt er an stellen mit stempeln oder unterschriften. sogar die funktion text ohne grafik sieht genau wie der scan aus. nur leider is die ocr-geschwindigkeit auf einem pentium 3ghz immer noch ziemlich zäh


Alle Zeitangaben in WEZ +2. Es ist jetzt 03:20 Uhr.

Powered by vBulletin® Copyright ©2000 - 2025, Jelsoft Enterprises Ltd.
© 2009 FSL Verlag