Экспорт текста из AdobeAcrobat

  • Автор темы Автор темы garif
  • Дата начала Дата начала
Статус
Закрыто для дальнейших ответов.

garif

Топикстартер
R.I.P.
Сообщения
8 112
Реакции
3 109
Знаю, что тема стара как мир, но интересует конкретный случай...
При экспорте (разными способами) текстовой информации из pdf-файла все пробелы исчезают (см. скриншот). Можно ли с этим как-то бороться?
Вариант с FineReader'ом не предлагать - сам знаю)). Но может быть, все очевидно, есть простое решение, а я просто немного торможу?
 

Вложения

  • Без имени-1.jpg
    Без имени-1.jpg
    218.8 КБ · Просм.: 919
Ответ: Экспорт текста из AdobeAcrobat

Простого решения нет, можно через GhostScript примочку сделать, 1998 подскажет, он в этих делах специалист.
 
Ответ: Экспорт текста из AdobeAcrobat

Можно кусок проблемного pdf посмотреть?
 
Ответ: Экспорт текста из AdobeAcrobat

ну да :)
что-то очень как-то криво прикреплен сам макет
Clip_19.jpg
маркер, понимаешь, безопасности (во как) у него неверный
 
Ответ: Экспорт текста из AdobeAcrobat


Не по теме:
Видимо опять я чего-то с файлообменником накосячил...
Хотя, у меня нормально скачивается.

 
Ответ: Экспорт текста из AdobeAcrobat

Ссылку надо копировать когда файл уже загружен или убирать то, что после file&id= и цифр.
http://forum.rudtp.ru/downloads.php?do=file&id=290&act=down&actionhash=1314202008-4c4b933e6ed679029721bdfb8481c81c3b7c0079
 
Ответ: Экспорт текста из AdobeAcrobat

InFix 3.30 нормально редактирует и копирует такой текст. Пробелы на месте.
скопировал в блокнот
Богородице-Рождественский ставропигиальный женский монастырь г. Москвы был основан 1386 г. матерью героя Куликовской битвы Владимира Андреевича Храброго княгиней Марией Серпуховской (в схиме – Марфой). Обитель задумана как духовный памятник победы духа, веры и братской любви о Христе русских людей, отложивших взаимные распри ради блага Отечества. Духовным наставником княгини Марии, ее близких и первых насельниц был преподобный Сергий Радонежский. Монастырь был устроен на началах строго общежития. Первыми сестрами стали вдовы, матери и сироты погибших на Куликовом поле воинов. В деле создания обители участвовали преподобная Ефросиния, великая княгиня Московская и супруга князя Владимира Храброго Елена Ольгердовна ( в монашестве – Евпраксия), принявшая на себя по смерти свекрови все заботы о монастыре. В стенах монастырского собора приняла постриг супруга Василия III Великая княгиня Соломония Сабурова – преподобная София Суздальская.
Где брать инфикс - гугль знает :)
 
Ответ: Экспорт текста из AdobeAcrobat

Йожег, спасибо огромное!
Но, все-таки, хочется пофилософствовать: почему напрямую не получается?
 
Ответ: Экспорт текста из AdobeAcrobat

Потому что там вместо пробелов всякая фигня. Специалисты объяснят лучше. Мне достаточно знать как это лечится.
 
Ответ: Экспорт текста из AdobeAcrobat

?? Фигня, говорите? "Возьмите питстоп", увидите, что там "вместо пробелов". Извлечение текста из такого файла характеризует уровень ИИ Акробата, увы.
+ Некоторые советы Вас до добра не доведут. Даже если речь о винде, то, думаю, с-копи-пастить сможете массой легальных просмотровщиков, например поставьте тот же Evince. Для массовой обработки наберите в гугле poppler-utils windows, третья ссылка ведет на бинарники, после чего

pdftotext.exe default000.pdf 1.txt
 
Ответ: Экспорт текста из AdobeAcrobat

Ну объясните страждущей аудитории.
 
Статус
Закрыто для дальнейших ответов.