[Acr X] Печать текста из PDF/a

  • Автор темы Автор темы Asvad
  • Дата начала Дата начала
Это что за поток сознания?:)
Это его распознанный текст, как я понимаю, то, что осталось после ocr. Вы исходный файл гляньте.
Здесь удалены битмапы, остались только результаты распознавания
То есть удалить сканы (или перенести их на отдельный слой), оставив только распознанный векторный текст, не проблема. Другой вопрос, что результат полностью зависит от результатов распознавания
 
Последнее редактирование:
В общем и целом, задача на 2 минуты работы, как я понял. Но качество полностью зависит от качества распознавания, если не считать пропавших таблиц и форматирования болдом
 
Последнее редактирование:
Можете еще покопать в сторону таких программ как ScanKromsator или ScanTailor. Они специализируются на работе со сканированными книгами. Умеют убирать тени, выпрямлять текст, который "выгнулся" при сканировании. И т. д.
 
  • Спасибо
Реакции: garvey