[Acr DC] Распознание текста

  • Автор темы Автор темы Palich_
  • Дата начала Дата начала
Статус
Закрыто для дальнейших ответов.

Palich_

Участник
Топикстартер
Сообщения
2
Реакции
0
Доброго времени суток!

Есть пдф файл в котором хочу "распознать текст".
мои действия:
1. повысить качество сканирования
2. распознать текст
Дальше выдается предупреждение "приложению acrobat не удалось выполнить распознование по следующей причине: нас странице содержится воспроизводимый текст"
Нажимаю "ок" и страницы где есть текст не распознаны. Их редактировать можно, но если пользоваться поиском то слова что пишу в поиске не находятся.
Подскажите, что нужно сделать что бы можно было искать слова в этом файле?
 
На самом деле, это не одна, а две проблемы.
Одна простая, вторая сложная.
Самый простой и дубовый способ решить обе - тупо перевести все страницы в растр, собрать из растровых картинок новый PDF и распознавать текст уже из него.
Более профессиональное решение требует гораздо больше начальных данных, свободного времени и исходной (вашей) компетенции.
 

Не по теме:
Не пугай человека
Я постарался ему как можно мягче и деликатнее объяснить, а ты...


'))'
 
  • Спасибо
Реакции: Валера1966
На самом деле, это не одна, а две проблемы.
Одна простая, вторая сложная.
Самый простой и дубовый способ решить обе - тупо перевести все страницы в растр, собрать из растровых картинок новый PDF и распознавать текст уже из него.
Более профессиональное решение требует гораздо больше начальных данных, свободного времени и исходной (вашей) компетенции.
да, как раз в растр я переводил и уже новый созданный пдф файл распозновал, но есть один существенный недостаток: такой файл становится тяжеловесом

спасибо за помощь, времени действительно нет на более глубокое изучение, буду работать с тяжеловесом )
 
Добавить watermark, flatten transpatency.
Я ж тебе говорю, у меня не на всех версиях срабатывало, да и то я пробовал на достаточно старых
Вдобавок, Flatten transparency тоже деструктивен и тоже пережимает, как показала практика
 
Статус
Закрыто для дальнейших ответов.