Распознавание текста по-прежнему FineReader или есть альтернативы?

  • Автор темы Автор темы Йожег
  • Дата начала Дата начала

Йожег

без телевизора
Топикстартер
12 лет на форуме
Сообщения
8 850
Реакции
4 276
Давно не занимался распознаванием но иногда возникает задача по-быстрому распознать для небольших кусков текста порой на весьма пестром фоне. Только Файнридер или есть другие программы и хорошо бы бесплатные. И что там творится онлайн?
 
Acrobat DС pro
 
  • Спасибо
Реакции: Йожег
Круто, но нету. К счастью оказалось что онлайн конвертеры нынче неплохо справляются. Не ожидал. Первая же распознавалка в поиске справилась весьма неплохо. Бесплатный онлайн инструмент OCR (Распознавание текста) — Convertio по джипегу с английским текстом достаточно грамотно сделал пдф.
 
Последнее редактирование:
IMG-20210811-WA0001.jpg
 
 
Бесплатный онлайн инструмент OCR
CuneiForm же, но не знаю до какого её состояния довели, была довольно слабая, относительно FineReader, зато OpenSource

Ну вот, как всегда, пока искал где и как оно нонче опередили.
 
Давайте вместо тараканов
Посадим в голову ежа,
Чтоб он фонариком дорогу
В тумане мыслям освещал…
 
Ну такой текст я и сам распознаю за 6 сек )) В реальности яндекс-переводчик слишком привередлив и распознал только самые крупные надписи. Вероятно на мемасиках его и тренировали. Попробовал скормить ему уже распознанный пдф - пусть хоть переведет, но и там облом.
 
Последнее редактирование:
не понимает же :) в растр сохрани
Да ладно все он в теории понимает )) Первая попытка была конечно с растром. Яндекс распознал только пару надписей 60-м кеглем, меньше - не царское это дело.
1628681176945.png
 
Последнее редактирование:
Да ладно все он в теории понимает )) Первая попытка была конечно с растром. Яндекс распознал только пару надписей 40-м кеглем, меньше - не царское это дело.
Посмотреть вложение 145587
Не-а :) Документ предполагает наличие готового текста, который он и пытается выдрать для перевода :) Картинку
 
Попробовал скормить ему уже распознанный пдф - пусть хоть переведет, но и там облом.
Не умеет он 14 кегль даже распознанный текст яндекс перевел только самые крупные и понятные надписи. Придется ему копипастить текст по кусочкам - пусть хоть так переводит.
 
Последнее редактирование:

>> Распознавание текста по-прежнему FineReader​

Да.
 
У меня и 8 распознал 'hz'
На, тренируйся )) переводы jpg и пдф распознанный онлайн. Вот что забавно текст с этого же пдф подсунутый переводчику ручками тот переводит без проблем даже с учетом лишних пробелов ошибки сам правит. Похоже недопилена у них распознавалка документов.
 
Последнее редактирование:
Tesseract ещё помню был.