Распознавание текста на церковно-славянском

Статус
Закрыто для дальнейших ответов.

WAW

Участник
Топикстартер
Сообщения
70
Реакции
0
Господа форумчане!
Вкраце задача состоит в переиздании нескольких стаых книг на церковно-славянском языке. До этого мне приходилось делать мах по 5-7 страниц А4, так что спокойно обходился набором вручную. Здесь же набирать такой объем будет несколько проблематично по срокам. Есть ли в природе готовые языки и эталоны под FineReader, или есть какие-нибудь альтернативные проги для распознания OCR-ок на церковно-славянском?
 

Glutton

12 лет на форуме
Сообщения
885
Реакции
1
Ответ: Распознавание текста на церковно-славянском

Шрифты есть?
Настрой ручками!
 

WAW

Участник
Топикстартер
Сообщения
70
Реакции
0
Ответ: Распознавание текста на церковно-славянском

Шрифты-то есть, но советую самому попробовать настроить ручками, т.к. FR во-первых, не понимает, что буквы с надстрочными знаками это не одна буква, а две. Т.е., если в наборе идет последовательность (для шрифта Orthodox) U+00E8 U+0034, то можно обучить FR или воспринимать букву и с исо (знак придыхания с тяжелым ударением), как и, или как исо. А в таких шрифтах, как Evangelie и Feofan он вообще на кодовой таблице половины знаков не видит. Тем более, что в д.с., что обучать, что набирать руками, по времени, если не одинаково, то соизмеримо. Почему и спрашиваю про эталоны и альтернативы.
 

KateLa

Участник
Сообщения
85
Реакции
0
Ответ: Распознавание текста на церковно-славянском

Тоже в свое время искала - ничего не нашла. Набирала вручную (правда, речь шла об одной книге).
Зато нашла AfterScan Antique — обработка старорусской орфографии и перевод в современную орфографию. Адрес: http://www.afterscan.com/ru
 

KORN

Участник
Сообщения
95
Реакции
0
Ответ: Распознавание текста на церковно-славянском

2WAW

Кроме http://orthlib.ru, да, пожалуй, ещё и http://akafistnik.narod.ru/ никто нормально не смог решить проблему сканирования церковно-славянских текстов. Я пробовал, у меня не очень получалось.
 

WAW

Участник
Топикстартер
Сообщения
70
Реакции
0
Ответ: Распознавание текста на церковно-славянском

Просто это задача не для разовой работы. Я прикинул, сколько мне на это надо времени и начальство решило, что выключать меня на столько из рабочего процесса бессмысленно. Хотя я и говрил, что это один раз сделал - и на всю оставшуюся жизнь.
 
Статус
Закрыто для дальнейших ответов.