@dr.cyber
Also mit Ghostscript/Ghostview kannst Du mit dem Kommando "Text extrahieren" den Text aus einem geladenen PDF-File raussaugen.
Allerdings ist der Text bis auf die Zeilenumbrüche absolut unformatiert - ein reines ASCII-txt-file.
Vielleicht hilft Dir das was?
Wäre dann die Reihenfolge - PDf->TXT->DOC
