[Acr DC] FineReader 15. Проблемы с распознаванием таблицы в PDF

  • Автор темы Автор темы Konsta
  • Дата начала Дата начала

Konsta

Топикстартер
15 лет на форуме
Сообщения
1 033
Реакции
25
Можете объяснить, почему OCR в FineReader распознает pdf с текстом как картинку, соответственно, полно ошибок.
Или я что-то не так делаю?
 
Можете объяснить, почему OCR в FineReader распознает pdf с текстом как картинку, соответственно, полно ошибок.
Или я что-то не так делаю?
А кто Вас знает, что Вы там делаете. Пример якобы "плохой" странички пфд — в студию.
 
А кто Вас знает, что Вы там делаете. Пример якобы "плохой" странички пфд — в студию.
Распознаю таблицы, в которых текст.
Нет хороших и плохих. Всегда так.
Имел наглость ожидать, что OCR FineReader просто считает текст, так нет же, он их как изображение распознает.
 
Какая разница, это же FineReader.
Я так понимаю, ТС хочет, чтобы текст брался из текстового слоя при его наличии (а он говорит, что текст есть и копируется), а не распознавался как из отсканированной картинки с появлением ошибок такого распознавания.
 
  • Спасибо
Реакции: Konsta
Во-первых не топикстартер, просто поднята старая тема о выходе 15 версии.
Во-вторых, как я понял, нужны именно таблицы, а не просто текст из них. Под временными затратами тоже имеется ввиду, что из просто текста делать обратно таблицы долго.
Но может это я не так понял.
Распознаю таблицы, в которых текст.
Нет хороших и плохих. Всегда так.
Это странновато, покажите хотя бы одну. В автоматическом режиме ошибок достаточно много, но таблицы все-таки далеко не всегда неправильно распознаются.
 
не распознавался как из отсканированной картинки с появлением ошибок такого распознавания
Вообще FR как бы изначально заточен на распознавание отсканированных картинок без каких-либо текстовых слоев, а от ошибок и текстовый слой не панацея.
 
  • Спасибо
Реакции: Lucky1978
George, извините, но все файлы, с которыми работаю, оговорены как коммерческая тайна.
 
Последнее редактирование модератором:
Хорошо, продолжим веселую угадайку
Настройки меняли?
Как таблицу копировали?
Без файнридера в doc экспортировали?
Собственно, что именно не так в распознавании - символы перевирает или табличное форматирование?
 
@Konsta, а тут настройки не влияют на это?
Посмотреть вложение 140756
Спасибо!
При переводе на текстовый режим количество ошибок сократилось раз в 30! К сожалению, не распознает пробелы и изредка теряется текст из некоторых ячеек, хотя копипастом этот текст переносится.
Не обращал внимание на эту настройку, так ка работаю и с текстом в графическом формате. Но, самое смешное, что, даже при установке "Использовать только текст..." распознает и графику. Причем, корректнее, чем при универсальной установке.