[Acr DC] FineReader 15. Проблемы с распознаванием таблицы в PDF

Konsta

Топикстартер
15 лет на форуме
Сообщения
1 033
Реакции
25
Можете объяснить, почему OCR в FineReader распознает pdf с текстом как картинку, соответственно, полно ошибок.
Или я что-то не так делаю?
 

George

I wish I was a monster you think I am
15 лет на форуме
Сообщения
17 301
Реакции
7 864
Можете объяснить, почему OCR в FineReader распознает pdf с текстом как картинку, соответственно, полно ошибок.
Или я что-то не так делаю?
А кто Вас знает, что Вы там делаете. Пример якобы "плохой" странички пфд — в студию.
 

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 138
Реакции
10 835

Konsta

Топикстартер
15 лет на форуме
Сообщения
1 033
Реакции
25
А кто Вас знает, что Вы там делаете. Пример якобы "плохой" странички пфд — в студию.
Распознаю таблицы, в которых текст.
Нет хороших и плохих. Всегда так.
Имел наглость ожидать, что OCR FineReader просто считает текст, так нет же, он их как изображение распознает.
 

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 138
Реакции
10 835

George

I wish I was a monster you think I am
15 лет на форуме
Сообщения
17 301
Реакции
7 864

suntory

Administrator
15 лет на форуме
Сообщения
23 349
Реакции
12 401

Lucky1978

12 лет на форуме
Сообщения
340
Реакции
125
Какая разница, это же FineReader.
Я так понимаю, ТС хочет, чтобы текст брался из текстового слоя при его наличии (а он говорит, что текст есть и копируется), а не распознавался как из отсканированной картинки с появлением ошибок такого распознавания.
 
  • Спасибо
Реакции: Konsta

suntory

Administrator
15 лет на форуме
Сообщения
23 349
Реакции
12 401
Во-первых не топикстартер, просто поднята старая тема о выходе 15 версии.
Во-вторых, как я понял, нужны именно таблицы, а не просто текст из них. Под временными затратами тоже имеется ввиду, что из просто текста делать обратно таблицы долго.
Но может это я не так понял.
Распознаю таблицы, в которых текст.
Нет хороших и плохих. Всегда так.
Это странновато, покажите хотя бы одну. В автоматическом режиме ошибок достаточно много, но таблицы все-таки далеко не всегда неправильно распознаются.
 

suntory

Administrator
15 лет на форуме
Сообщения
23 349
Реакции
12 401
не распознавался как из отсканированной картинки с появлением ошибок такого распознавания
Вообще FR как бы изначально заточен на распознавание отсканированных картинок без каких-либо текстовых слоев, а от ошибок и текстовый слой не панацея.
 
  • Спасибо
Реакции: Lucky1978

Konsta

Топикстартер
15 лет на форуме
Сообщения
1 033
Реакции
25
George, извините, но все файлы, с которыми работаю, оговорены как коммерческая тайна.
 
Последнее редактирование модератором:

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 138
Реакции
10 835
Хорошо, продолжим веселую угадайку
Настройки меняли?
Как таблицу копировали?
Без файнридера в doc экспортировали?
Собственно, что именно не так в распознавании - символы перевирает или табличное форматирование?
 

Konsta

Топикстартер
15 лет на форуме
Сообщения
1 033
Реакции
25
@Konsta, а тут настройки не влияют на это?
Посмотреть вложение 140756
Спасибо!
При переводе на текстовый режим количество ошибок сократилось раз в 30! К сожалению, не распознает пробелы и изредка теряется текст из некоторых ячеек, хотя копипастом этот текст переносится.
Не обращал внимание на эту настройку, так ка работаю и с текстом в графическом формате. Но, самое смешное, что, даже при установке "Использовать только текст..." распознает и графику. Причем, корректнее, чем при универсальной установке.