Страница 1 из 1

PDF в Линукс. Как скопировать текст?

Добавлено: 12 дек 2005, 12:57
ksaphan
Как скопировать текст из PDF файла под линукс? Или конвертировать в любой текстовый формат (doc, rtf...) ?
Может быть какая-то софтина есть? Помогите!
В стандартных софтинах, которые идут в дистрибутиве (у меня SuSE10), нельзя скопировать текст.

Добавлено: 12 дек 2005, 13:42
leikind
У меня есть (debian) программка ps2ascii, находится в пакете pstotext. Обработает и pdf.

Добавлено: 12 дек 2005, 14:21
mihail
Смотри утилиту pdftotex из комплекта xpdf

Также можно попробовать импорт в koffice версией поновее. Если нормально симпортирует, то через выделение-копировать-вставить. Но результат не гарантирован.

Добавлено: 12 дек 2005, 14:58
mend0za
Disclaimer - операция изъятия текста из pdf - дело негарантированное. Текст может быть впечатан графикой, а может быть и в тексте, как повезёт.

Код: Выделить всё

pdftk - A useful tool for manipulating PDF documents
xpdf-utils - Portable Document Format (PDF) suite -- utilities
pdftk - разжатие pdf
pdftotext (из xpdf-utils) - извлечение текста

Так почему-то получался лучший результат.
См. ссылку по этому поводу (перегонял словари из PDF в DICT).

http://cvs.gna.org/cvsweb/i18n-komi/dic ... =i18n-komi

Добавлено: 13 дек 2005, 00:50
booxter
kpdf пачынаючы з 3.4.0 дазваляе гэта.

Добавлено: 13 дек 2005, 14:43
bobrik
Вообще то не от дистра зависит, а то просмотрщика. Наверное у человека xpdf? Вообще я пользуюсь evince