[Acr X] Печать текста из PDF/a

zollinger

Участник
Сообщения
553
Реакции
168
Это что за поток сознания?:)
Это его распознанный текст, как я понимаю, то, что осталось после ocr. Вы исходный файл гляньте.
Здесь удалены битмапы, остались только результаты распознавания
То есть удалить сканы (или перенести их на отдельный слой), оставив только распознанный векторный текст, не проблема. Другой вопрос, что результат полностью зависит от результатов распознавания
 
Последнее редактирование:

zollinger

Участник
Сообщения
553
Реакции
168
В общем и целом, задача на 2 минуты работы, как я понял. Но качество полностью зависит от качества распознавания, если не считать пропавших таблиц и форматирования болдом
 
Последнее редактирование:

lmn1

15 лет на форуме
Сообщения
530
Реакции
216
Можете еще покопать в сторону таких программ как ScanKromsator или ScanTailor. Они специализируются на работе со сканированными книгами. Умеют убирать тени, выпрямлять текст, который "выгнулся" при сканировании. И т. д.
 
  • Спасибо
Реакции: garvey