Распознавание текста по-прежнему FineReader или есть альтернативы?

Йожег

без телевизора
Топикстартер
12 лет на форуме
Сообщения
8 836
Реакции
4 275
Давно не занимался распознаванием но иногда возникает задача по-быстрому распознать для небольших кусков текста порой на весьма пестром фоне. Только Файнридер или есть другие программы и хорошо бы бесплатные. И что там творится онлайн?
 

mnemonix

ॐ मणि पद्मे हूँ
Сообщения
579
Реакции
175
Acrobat DС pro
 
  • Спасибо
Реакции: Йожег

Йожег

без телевизора
Топикстартер
12 лет на форуме
Сообщения
8 836
Реакции
4 275
Круто, но нету. К счастью оказалось что онлайн конвертеры нынче неплохо справляются. Не ожидал. Первая же распознавалка в поиске справилась весьма неплохо. Бесплатный онлайн инструмент OCR (Распознавание текста) — Convertio по джипегу с английским текстом достаточно грамотно сделал пдф.
 
Последнее редактирование:

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 227
Реакции
10 851
IMG-20210811-WA0001.jpg
 

Gad

Сообщения
2 975
Реакции
1 408
 

JAW

15 лет на форуме
Сообщения
15 797
Реакции
3 454
Бесплатный онлайн инструмент OCR
CuneiForm же, но не знаю до какого её состояния довели, была довольно слабая, относительно FineReader, зато OpenSource

Ну вот, как всегда, пока искал где и как оно нонче опередили.
 

Gad

Сообщения
2 975
Реакции
1 408
Давайте вместо тараканов
Посадим в голову ежа,
Чтоб он фонариком дорогу
В тумане мыслям освещал…
 

Йожег

без телевизора
Топикстартер
12 лет на форуме
Сообщения
8 836
Реакции
4 275
Ну такой текст я и сам распознаю за 6 сек )) В реальности яндекс-переводчик слишком привередлив и распознал только самые крупные надписи. Вероятно на мемасиках его и тренировали. Попробовал скормить ему уже распознанный пдф - пусть хоть переведет, но и там облом.
 
Последнее редактирование:

Йожег

без телевизора
Топикстартер
12 лет на форуме
Сообщения
8 836
Реакции
4 275
не понимает же :) в растр сохрани
Да ладно все он в теории понимает )) Первая попытка была конечно с растром. Яндекс распознал только пару надписей 60-м кеглем, меньше - не царское это дело.
1628681176945.png
 
Последнее редактирование:

Gad

Сообщения
2 975
Реакции
1 408
Да ладно все он в теории понимает )) Первая попытка была конечно с растром. Яндекс распознал только пару надписей 40-м кеглем, меньше - не царское это дело.
Посмотреть вложение 145587
Не-а :) Документ предполагает наличие готового текста, который он и пытается выдрать для перевода :) Картинку
 

Йожег

без телевизора
Топикстартер
12 лет на форуме
Сообщения
8 836
Реакции
4 275
Попробовал скормить ему уже распознанный пдф - пусть хоть переведет, но и там облом.
Не умеет он 14 кегль даже распознанный текст яндекс перевел только самые крупные и понятные надписи. Придется ему копипастить текст по кусочкам - пусть хоть так переводит.
 
Последнее редактирование:

George

I wish I was a monster you think I am
15 лет на форуме
Сообщения
17 323
Реакции
7 870

>> Распознавание текста по-прежнему FineReader​

Да.
 

George

I wish I was a monster you think I am
15 лет на форуме
Сообщения
17 323
Реакции
7 870

Йожег

без телевизора
Топикстартер
12 лет на форуме
Сообщения
8 836
Реакции
4 275
У меня и 8 распознал 'hz'
На, тренируйся )) переводы jpg и пдф распознанный онлайн. Вот что забавно текст с этого же пдф подсунутый переводчику ручками тот переводит без проблем даже с учетом лишних пробелов ошибки сам правит. Похоже недопилена у них распознавалка документов.
 
Последнее редактирование:

~RA~

Одарённая.
12 лет на форуме
Сообщения
11 885
Реакции
3 456
Tesseract ещё помню был.