Страница 1 из 1
PDF в Линукс. Как скопировать текст?
Добавлено: 12 дек 2005, 12:57
ksaphan
Как скопировать текст из PDF файла под линукс? Или конвертировать в любой текстовый формат (doc, rtf...) ?
Может быть какая-то софтина есть? Помогите!
В стандартных софтинах, которые идут в дистрибутиве (у меня SuSE10), нельзя скопировать текст.
Добавлено: 12 дек 2005, 13:42
leikind
У меня есть (debian) программка ps2ascii, находится в пакете pstotext. Обработает и pdf.
Добавлено: 12 дек 2005, 14:21
mihail
Смотри утилиту pdftotex из комплекта xpdf
Также можно попробовать импорт в koffice версией поновее. Если нормально симпортирует, то через выделение-копировать-вставить. Но результат не гарантирован.
Добавлено: 12 дек 2005, 14:58
mend0za
Disclaimer - операция изъятия текста из pdf - дело негарантированное. Текст может быть впечатан графикой, а может быть и в тексте, как повезёт.
Код: Выделить всё
pdftk - A useful tool for manipulating PDF documents
xpdf-utils - Portable Document Format (PDF) suite -- utilities
pdftk - разжатие pdf
pdftotext (из xpdf-utils) - извлечение текста
Так почему-то получался лучший результат.
См. ссылку по этому поводу (перегонял словари из PDF в DICT).
http://cvs.gna.org/cvsweb/i18n-komi/dic ... =i18n-komi
Добавлено: 13 дек 2005, 00:50
booxter
kpdf пачынаючы з 3.4.0 дазваляе гэта.
Добавлено: 13 дек 2005, 14:43
bobrik
Вообще то не от дистра зависит, а то просмотрщика. Наверное у человека xpdf? Вообще я пользуюсь evince