Замена в национальном тексте

  • Автор темы Автор темы Asvad
  • Дата начала Дата начала
Статус
Закрыто для дальнейших ответов.

Asvad

Топикстартер
10 лет на форуме
Сообщения
110
Реакции
23
Я живу в Дагестане и ес-но у нас верстаются в основном национальные тексты. Используется конечно кирилица + лигатуры. Больше всего вызывает проблему лигатура с вертикальной палочкой. Каждый набирает её как хочет: |, I, 1...

Чаще всего с 1.
Билун буго к1иго ч1ег1ераб г1ач1ар. Цоялъул кваранаб г1иналда буго цебесан гьубил милъир, мекъаб г1ин хъвалхьараб. К1иабилелъул кваранаб г1иналда буго цебесан гьубил милъир. Гьел рихьарав чияс лъазабизе бегьула Х1отода росулъа Ибрагьимов Мух1амадида яги ах1изе бегьула гьаб номералде…

или заглавная буква i
Билун буго кIиго чIегIераб гIачIар. Цоялъул кваранаб гIиналда буго цебесан гьубил милъир, мекъаб гIин хъвалхьараб. КIиабилелъул кваранаб гIиналда буго цебесан гьубил милъир. Гьел рихьарав чияс лъазабизе бегьула ХIотода росулъа Ибрагьимов МухIамадида яги ахIизе бегьула гьаб номералде…

Я же предлагаю эту палочку делать строчной буквой l (L).
Билун буго кlиго чlегlераб гlачlар. Цоялъул кваранаб гlиналда буго цебесан гьубил милъир, мекъаб гlин хъвалхьараб. Кlиабилелъул кваранаб гlиналда буго цебесан гьубил милъир. Гьел рихьарав чияс лъазабизе бегьула Хlотода росулъа Ибрагьимов Мухlамадида яги ахlизе бегьула гьаб номералде…

Потому как все это как то сносно выглядит пока текст набран нормалом, а проблемы начинаются при курсиве
Билун буго к1иго ч1ег1ераб г1ач1ар.
Билун буго кIиго чIегIераб гIачIар.
Билун буго кlиго чlегlераб гlачlар.


Задача. Как мне сформировать GREP, чтоб он заменял |, I, 1 на l и при этом не забывать, что в тексте могут встречаться другие цифры (даты, показатели и т.д.)? Если конечно такое возможно.
 
Насколько я понимаю, эта лигатура обязана стоять перед гласной.
Ищите: 1([и|е|о|а])
Меняйте на что вам нужно: l$1
Уточните, пожалуйста, обязательно ли этот элемент стоит после согласной? Внутри слова?
Если есть, пришлите картинку того, как эта лигатура выглядит в правильно напечатанной книге.
Какой именно это язык?
 
Или лучше так (если внутри слова):
Find: (?<=\w)1([и|е|о|а])
Replace: l$1

Уточните, ловит ли этот поиск какие-то не те случаи (цифры в других местах и т.п.), т.е. - чего следует избегать.
 
Лигатуры аварского языка - гl, лl, кl, чl, тl, цl, хl, гь, ль, кь, хь, гъ, лъ, къ, хъ, цц, кк.
Палочка может быть и в конце слова - ракl (сердце), гамачl (камень).
Из гласных букв лигатуры не образовываются. Только в кумыкском языке есть лигатурв из пары "оь"
 
Последнее редактирование:
Отлично. Ищете сочетания:
(?<=г|л|к|ч|т|ц|x)1
Replace: l
 
  • Спасибо
Реакции: Asvad
полагаю, если учитывать прописные буквы то писать
(?<=Г|Л|К|Ч|Т|Ц|Х|г|л|к|ч|т|ц|x)1
 
Остальные все равно будут набирать 1 и l
Поскольку на компьютерах бывают проблемы с вводом и отображением «палочки», её продолжают заменять латинской буквой I или даже цифрой 1.
 
А как в словарях?
 
Статус
Закрыто для дальнейших ответов.