А кто Вас знает, что Вы там делаете. Пример якобы "плохой" странички пфд — в студию.Можете объяснить, почему OCR в FineReader распознает pdf с текстом как картинку, соответственно, полно ошибок.
Или я что-то не так делаю?
Попробуйте для начала удалить остальные картинки в PDFсоответственно, полно ошибок
если можно просто скопировать? Или таки не?pdf с текстом
Распознаю таблицы, в которых текст.А кто Вас знает, что Вы там делаете. Пример якобы "плохой" странички пфд — в студию.
Я выделяю область с текстом. Остальное не подвергается анализу OCR.Попробуйте для начала удалить остальные картинки в PDF
Ну, если есть десяток-другой свободных часов, то можно... Но их нету.А зачем распознавать
если можно просто скопировать? Или таки не?
Вы не поняли мой намек.в которых текст.
Разумеется, в этом и смысл вопроса. Причем, копируется правильно.Вы не поняли мой намек.
Вы точно уверены, что там именно текст?
Он копируется?
Может чего-то не понял ...Ну, если есть десяток-другой свободных часов,
Можно явно указать что это таблицаЯ выделяю область с текстом.
Какая разница, это же FineReader.Вы точно уверены, что там именно текст?
Я так понимаю, ТС хочет, чтобы текст брался из текстового слоя при его наличии (а он говорит, что текст есть и копируется), а не распознавался как из отсканированной картинки с появлением ошибок такого распознавания.Какая разница, это же FineReader.
Это странновато, покажите хотя бы одну. В автоматическом режиме ошибок достаточно много, но таблицы все-таки далеко не всегда неправильно распознаются.Распознаю таблицы, в которых текст.
Нет хороших и плохих. Всегда так.
Вообще FR как бы изначально заточен на распознавание отсканированных картинок без каких-либо текстовых слоев, а от ошибок и текстовый слой не панацея.не распознавался как из отсканированной картинки с появлением ошибок такого распознавания
Мне не нужно doc>pdf>doc.Может чего-то не понял ...
Сделал doc>pdf>doc заняло секунды...
Спасибо!