Белорусские переносы и InDesign

MAO_the_Doom

Топикстартер
15 лет на форуме
Сообщения
2 408
Реакции
224
Предлагаю всем заинтересованным обсудить проблему БЕЛОРУССКИХ переносов для Индизайна. Кто чем и как пользуется. Я знаю вот что (может кто что дополнит):

1. Можно пользоваться CS2 и winsoftовским модулем для белпереносов.

2. Можно пользоваться CS3, прикрутив Вордовский модуль белорусских переносов к Dash, но для этого и Ворд надо иметь с белпереносами вроде бы? Я такой реализации не встречал во всяком случае.

3. Теперь вышел CS4, Dash на него не ставится. Вообще развитие Dash вызывает сомнение, т.к. тов. Батов распространяет более мощную поддержку переносов (но белорусских у него нету), на которую вcе переходят с Dash.

4. Есть вариант создания пользовательского словаря белорусских переносов, прикручивающегося к русским переносам.

Просьба высказваться, т.к. есть намётки+идея (возможно бредовая) по п.4, которую выскажу ТОЛЬКО при наличии активного интереса у коллег. Всё писать на эту тему только сюда, без лички.
 
Ответ: Белорусские переносы и InDesign

Слишком большой пользовательский словарь драматически замедляет работу приложения в целом. Я не знаю белорусского языка и насколько сильно он отличается от русского тоже, но полагаю что это не вариант.
 
Ответ: Белорусские переносы и InDesign

CS2 forever или платить спецам.
 
Ответ: Белорусские переносы и InDesign

Каким спецам и сколько? - скажу заинтересованному главреду.

Слишком большой словарь и не требуется. Белорусский очень похожь на русский, в смысле что переносы выставляются почти по такому же алгоритму, именно поэтмоу берется за основу готовый русский модуль. Остается помочь этому модулю переносить правильно некоторую часть незнакомых ему слов с ў-дз-дж и т.п. В результате получаем ХОТЬ какой-то сносный белорусский перенос, который возможно будет не хуже винсофтовского под CS2, и плюс который не зависит от версии Индизайна.

Сколько тысяч слов нужно, чтобы заметно подвешивать программу?

Maks_Tsofin, а как у нас люди выкручиваются? Неужели все сидят на CS2 только ради белорусского языка?
 
Ответ: Белорусские переносы и InDesign

MAO_the_Doom сказал(а):
Сколько тысяч слов нужно, чтобы заметно подвешивать программу?

Полагаю, это зависит от производительности вашего ПК. Можно взять словарь, который выкладывал Игорь Батов, порезать его на куски и добавлять потихоньку, до тех пор, пока индизайн не перестанет шевелиться.
 
Ответ: Белорусские переносы и InDesign

MAO_the_Doom сказал(а):
Maks_Tsofin, а как у нас люди выкручиваются? Неужели все сидят на CS2 только ради белорусского языка?

Именно так, и нечего другого. У меня в коллективе одни дамы. Попробуй их к чему-нибудь новому пристрастить. Вот заработает у меня под вистой цс4, может от безделия нормальными переносами займусь. А под цс3 уже не интересно.
 
Ответ: Белорусские переносы и InDesign

дык ты глянь в свою тему, у меня похожий глюк вылез - может решение поможет?
 
Ответ: Белорусские переносы и InDesign

То есть, у нескладовае, дз, дж приходится переносить вручную? ИнДизайн их не понимает, даже если устанавливается на беларускую мову?
 
Ответ: Белорусские переносы и InDesign

ИнДизайн их не понимает, даже если устанавливается на беларускую мову?
В индизайне уже есть белорусский язык? :)
 
Ответ: Белорусские переносы и InDesign

В Индизайне по-дефолту нет белорусского модкля переносов. Этим делом периодически приторговывает Винсофт, причем для покупки надо ввести реальный серийник честнокупленной версии CS# - как-то так вроде.
 
Ответ: Белорусские переносы и InDesign

Не винсофт - а вудвинг - SmartHyphenation - плагин
 
Ответ: Белорусские переносы и InDesign

а, ну да Вудвинг.
Хотя вот для CS2 - WinSoft_Linguistic_Module - им пользовался.
 
Ответ: Белорусские переносы и InDesign

Готов внести посильный вклад, хотя белорусский язык в работе не используется, но кто знает, что может понадобиться в перспективе?
идея (возможно бредовая)
это наверное перелопачивание большого теста с созданием пользовательского словаря?
 
Ответ: Белорусские переносы и InDesign

что-то типа этого. Требуется перелопатить пребольшую кучищу слов. Нужен грамотный корректор. Есессно за деньги. Если достаточному количеству людей это будет интересно, то можно будет вскладчину оплатить работу корректора, а нам поиметь словарь переносов, не зависящий от версий Индизайна.
 
Ответ: Белорусские переносы и InDesign

кстати а сколько должно быть в словаре слов, чтобы он получился пригодным для использования? Я понимаю что чем больше, тем лучше, но оптимально для нормлаьной работы - сколько? 10000, 50000, 100000, 300000, 500000, 1млн слов?
 
Ответ: Белорусские переносы и InDesign

Можно добротно отсканировать и вдумчиво распознать бел/рус словарь (только белорусские слова). А потом в индизе все это мрачно перелопачивать.

Можно спросить у г-на Батова сколько он возьмет за доработку bah'a под бел язык.
 
Ответ: Белорусские переносы и InDesign

А вот даже есть готовый словарь, наверное неплохой, но тарашкевица вроде
http://www.onlinedisk.ru/file/90933/
 
Ответ: Белорусские переносы и InDesign

Кстати, интересно насколько русские словари подходят для белорусского.
Просто, помнится, Кнут писал, что американский словарь для TeX в принципе местами работает и с другими языками.

Можно поискать словарь для TeX, или OpenOffice (там то же самое) и попытаться написать модуль переносов, благо исходников достаточно. Нужно только к ID прикрутить.

P.S. В прочем не нашёл белорусского словаря для TeX.

Вообще построение словаря переносов языка работа мрачная.
Нужна как минимум база переносов.
Батов, в принципе, переписал Кнутовский генератор паттернов, который работает по словарю (исходный был даже не 7 битный, вообще только на латиницу ориентированный).
 
Ответ: Белорусские переносы и InDesign

Русский подходит, кроме случаев переноса дж и дз (а это в белорусском языке особые буквы, как их правильно назвать? диграфы?) как д-/ж и д-/з, и отлавливать их очень напряжно
 
Ответ: Белорусские переносы и InDesign

t34 сказал(а):
Можно спросить у г-на Батова сколько он возьмет за доработку bah'a под бел язык.
Уважаемый коллега, с Александром мы этот вопрос уже решили. Я эту работу делаю на свой страх и риск. Пока идет она тяжело: незнание языка сказывается. Поскольку версия для белорусского языка никак не может быть хуже версии для русского языка (чтобы не дискредитировать версию классическую), то обнародована белорусская версия будет только при условии, что краснеть за нее придется... Что это означает по времени, сейчас сказать не берусь... Работаю.

Вы меня не ждите... Начинайте новый проект. Наверняка какая-то из двух разработок окажется удачной. Мне кажется только, что начать надо с другого. Не следует все подряд слова помещать в пользовательский словарь. Стоит алгоритмизировать Правила переносов... (С одной стороны, это не сложно, с другой -- этим мы покроем около 90% всех случаев.) Нет смысла включать в словарь простейшие формы типа "собака" и т. п. Это позволит увеличить быстродействие программы и уменьшить количество слов в словаре... Хотелось бы уложиться тысяч в десять (со всеми словоформами)...

P.S. Я хотел попросить: не могли бы Вы прислать мне скан с текстом Правил переноса для белорусского языка. Для украинского, например, удалось найти очень четкие и толковые формулировки. Для белорусского пока не получается...