FineReader примет это нормально или нет? Листы содержут буквы старого мремени.

  • Автор темы Автор темы needit
  • Дата начала Дата начала
Статус
Закрыто для дальнейших ответов.

needit

Участник
Топикстартер
Сообщения
265
Реакции
5
На листах копия старого издания, содержащего, например, букву i и др. буквы того времени. FineReader переведет нормально это в электронный вид или пропустит, или не правильно переведёт?
Может есть какие-нибудь советы по переносу таких букв в электронный вид? Может можно как-то подгрузить словарь букв того времени?
Еще листы, темноватые. Не получится ли так, что FinneRader не будет нормально распозновать текст из-за этого и будет путаться? Потому что бумага темнее белого, темная.

Собираю информацию.
Я этим заниматься не буду, узнаю для издательства.
 
Ответ: FineReader примет это нормально или нет? Листы содержут буквы старого мремени.

А Вы попробуйте. Всё он распознает.
 
Ответ: FineReader примет это нормально или нет? Листы содержут буквы старого мремени.

Выложите листок если файнридера у самих нету. Он и современный текст может не распознать. Сильно зависит от качества оригинала. Если на глаз плохо читается то и файнридер чудес не совершит. Фон лучше осветлить если возможно без потери четкости букв.
 
Ответ: FineReader примет это нормально или нет? Листы содержут буквы старого мремени.

У FineReader есть режим "обучение". Его можно обучить распознавать определенные буквы.
 
Ответ: FineReader примет это нормально или нет? Листы содержут буквы старого мремени.

В режиме обучения прекрасно распознаётся всякая шрифтовая экзотика.
А вот качество сканирования желательно улучшить. Можно сканировать даже в цвете, подбор яркости автоматический сканером или программой.
 
Ответ: FineReader примет это нормально или нет? Листы содержут буквы старого мремени.


Не по теме:
Скачал недавно Чейза, так там "высокий грузный неф шагнул ко мне" Разумеется должно быть негр :) Просто две буковки слились. Но эта ошибка повторялась по всей книге. Обучили, блин.
 
Ответ: FineReader примет это нормально или нет? Листы содержут буквы старого мремени.

Зачем кого-то там обучать если у него и так IQ зашкаливает? Копать в сторону «Русский (старая орфография)»…
Если нету курить оффсайт…
 

Вложения

  • FR10.jpg
    FR10.jpg
    34.1 КБ · Просм.: 952
Ответ: FineReader примет это нормально или нет? Листы содержут буквы старого мремени.

Выложите листок если файнридера у самих нету. Он и современный текст может не распознать. Сильно зависит от качества оригинала. Если на глаз плохо читается то и файнридер чудес не совершит. Фон лучше осветлить если возможно без потери четкости букв.
Чудеса он совершает, сомнительные слова по словарю проверяются... распознавал и факсовые распечатки, и бледную печатную машинку на желтой бумаге которые читались с сильными затруднениями. Хотя конечно бывают и сильно запущенные случаи.
 
Ответ: FineReader примет это нормально или нет? Листы содержут буквы старого мремени.

Спасибо за ваши сообщения!
Мне знакомый сказал поставить вверху русско-английский словарь и будет лучше. В частности i, распознает. Как быть, например с "ять"?
Может подгрузить специальный словарь? Где такой взять и как подгрузить?
 
Ответ: FineReader примет это нормально или нет? Листы содержут буквы старого мремени.

В частности i, распознает
Неправильно распознает скорее всего
http://ru.wikipedia.org/wiki/І_(кириллица)
http://ru.wikipedia.org/wiki/Дореволюционная_орфография#.D0.91.D1.83.D0.BA.D0.B2.D0.B0_.D0.86

Где такой взять
Не надо брать, он уже там должен быть.
Копать в сторону «Русский (старая орфография)
В дополнительных языках искать.

http://cslav.orthonet.ru/viewtopic.php?t=3483
http://publ.lib.ru/cgi/forum/YaBB.pl?num=1120663080/23
http://www.djvu-scan.ru/forum/index.php?action=profile;area=showposts;u=979
http://mirknig.com/forum/topic_5839
 
Ответ: FineReader примет это нормально или нет? Листы содержут буквы старого мремени.

Практика показывает - после автоматического распознавания, даже самого лучшего, требуется редактор-корректор. На этой должности не стоит экономить. Проверено годами.
 
Ответ: FineReader примет это нормально или нет? Листы содержут буквы старого мремени.

Ну вот даже пдф в кривых оно не распознает совсем без ошибок. Так что чего уж там. Казалось бы черный текст на белом фоне, минимум графики однако... пара ошибок было причем таких что не поймешь без корректора. Орфография правильная, по смыслу не то. Пдф http://forum.rudtp.ru/downloads.php?do=file&id=626 ворд http://forum.rudtp.ru/downloads.php?do=add сделанное/вделанное первая колонка
 
Ответ: FineReader примет это нормально или нет? Листы содержут буквы старого мремени.

Орфография правильная, по смыслу не то. http://forum.rudtp.ru/downloads.php?do=file&id=626
Это было проблемой в третьей или четвертой версии файнридера, во всех поздних таких явных корректировок не было (они все обозначалась как неуверенно распознанные).
Вообще сначала идет автоматическое распознавание. Затем ручками постранично проверяешь. Прощелкиваешь F4 (или уж забыл как) по неуверенно распознанным словам. Потом экспорт в ворд и приглаживание с проверкой там.
Процент финальных ошибок при этом очень минимальный. Хотя скоро будет и смысловая проверка, есть уже наработки по нейронам, многоядерным системам и анализу текстов на естественном языке.
 
Ответ: FineReader примет это нормально или нет? Листы содержут буквы старого мремени.

Хотя скоро будет и смысловая проверка, есть уже наработки по нейронам, многоядерным системам и анализу текстов на естественном языке.
В комплекте прилагается "облачная" система ИИ "Корректор", оплата эксплуатации системы постраничная.
Так же прилагается система "Автовёрстка".
 
Ответ: FineReader примет это нормально или нет? Листы содержут буквы старого мремени.

splxgf, 10-й файнридер. Реальный пример недельной давности. Неуверенные слова я проверяю. Как видим слово "вделанное" не помечено как неуверенное.
Clip_111.jpg
 
Статус
Закрыто для дальнейших ответов.