Когда-то давно я писал "проворачиватель фарша назад" - восстановление текста по кривым, при наличии шрифта, которым когда-то был набран данный текст.
За основу взял данную статью -
SciTecLibrary - Cтатьи и Публикации (выискал первую попавшуюся по ключевым словам когда-то сохраненного текста, может найдёте получше).
Мои результаты: если текст не подвергался искажениям, то отдельные буквы, в т.ч. и с поворотами, отлавливались практически на 100%, до слияния букв в текст я не добрался, стало лень. Ставил опыты с предыскаженными буквами, но сильно разрасталась база.
Побочные эффекты: буквами заменялись и короткие прямоугольнички (на тире и дефисы), кружочки (на точки и баллеты), и т.д. Симметричные буквы, как "О", иногда вставали вверх ногами (до приделывания отслеживания ориентации по соседним буквам я не дошел по причине той же лени). В строку могли набраться буквы из разных шрифтов при совпадении начертаний (тоже стоило отслеживать по соседям).