Глазам не поверил... Неужели уже пять лет прошло?
###
Работа над BaH завершена. Можно, конечно, продолжать шлифовать, дорабатывать, что-то оптимизировать, но никаких кардинальных изменений уже не будет. Проект завершен. Соответственно перехожу к следующему этапу. Попробую перевести переносы BaH на язык TeX.
Задача эта непростая. Набор паттернов ruhyphib.tex не должен демонстрировать результат, сильно уступающий тому, что показывает оригинальная версия BaH. Но как этого добиться?
Вот, например, одна из проблем — слова на "нео". Это случаи высшей категории трудности. Ни одна программа, кроме BaH, даже не пытается с ними справиться... Какие-то алгоритмы переносят "не-о", какие-то — "нео-". Но все это без какого-либо анализа. Понятно, что в половине случаев переносят правильно
Для алгоритмов, использующих паттерны TeX, эта задача, как мне представляется, вообще является крайне трудной, если не неразрешимой. Дело в том, что очень часто, решить вопрос о постановке переноса можно лишь переместившись на восемь-десять символов вдоль буквенной цепочки: "нео-существо" и "не-осуществимый", "нео-государства" и "не-огосударствление" и т. п.
Я не знаю никого, кто работал бы с паттернами такой длины. В подобных случаях фактически имеет место перенос по словарю. Таблицы паттернов катастрофически растут в размерах, да и сами паттерны становятся слишком длинными...
BaH справляется с большей частью подобных случаев (за счет использования регулярных выражений), но при построении набора паттернов, который бы обеспечивал сопоставимое качество, я столкнулся с описанной выше проблемой и решения пока не нашел...
Работа продолжается. Как будет что предъявить, обязательно расскажу. Там много всего интересного.