Как скопировать текст из PDF файла под линукс? Или конвертировать в любой текстовый формат (doc, rtf...) ?
Может быть какая-то софтина есть? Помогите!
В стандартных софтинах, которые идут в дистрибутиве (у меня SuSE10), нельзя скопировать текст.
PDF в Линукс. Как скопировать текст?
Disclaimer - операция изъятия текста из pdf - дело негарантированное. Текст может быть впечатан графикой, а может быть и в тексте, как повезёт.
pdftk - разжатие pdf
pdftotext (из xpdf-utils) - извлечение текста
Так почему-то получался лучший результат.
См. ссылку по этому поводу (перегонял словари из PDF в DICT).
http://cvs.gna.org/cvsweb/i18n-komi/dic ... =i18n-komi
Код: Выделить всё
pdftk - A useful tool for manipulating PDF documents
xpdf-utils - Portable Document Format (PDF) suite -- utilities
pdftotext (из xpdf-utils) - извлечение текста
Так почему-то получался лучший результат.
См. ссылку по этому поводу (перегонял словари из PDF в DICT).
http://cvs.gna.org/cvsweb/i18n-komi/dic ... =i18n-komi
И увидел я зверя, выходящего из тундры. И число его было 3.14159265358979324...
- bobrik
- Неотъемлемая часть форума
- Сообщения: 313
- Зарегистрирован: 17 авг 2005, 12:42
- Откуда: Витебск
- Контактная информация:
Вообще то не от дистра зависит, а то просмотрщика. Наверное у человека xpdf? Вообще я пользуюсь evince
http://bobrik.name - я не вар'ят