[ID CS4-CS6] Пробел и первые пять букв любого регистра

dastin

Некромант-любитель
12 лет на форуме
Сообщения
2 146
Реакции
2 043
можно я ещё влезу ... если проблема в (кое-кто, кое-что, куда-нибудь ...)
может так
/\-+(?!(кто|что|нибудь|то))/ - найдет дефис, если за ним не следует [кто что нибудь то ... можно ещё расширить] - дальше его можно поменять на перенос
 

Jeine

Да здравствует разум! Да сгинет маразм!
Топикстартер
15 лет на форуме
Сообщения
7 310
Реакции
6 315

dastin

Некромант-любитель
12 лет на форуме
Сообщения
2 146
Реакции
2 043
может я не там проверяю?
upload_2018-7-18_16-51-2.png

upload_2018-7-18_16-51-26.png
 

Jeine

Да здравствует разум! Да сгинет маразм!
Топикстартер
15 лет на форуме
Сообщения
7 310
Реакции
6 315
Это что?
Я пытаюсь работать с Найти/Заменить через GREP.
 

dastin

Некромант-любитель
12 лет на форуме
Сообщения
2 146
Реакции
2 043
так индезайна у меня нет - это просто тестер выражений regexp ...
 

suntory

Administrator
15 лет на форуме
Сообщения
23 431
Реакции
12 477
Последнее редактирование:
  • Спасибо
Реакции: Jeine

К.Т.

Участник
Сообщения
324
Реакции
337
Возможен такой подход:
1. Вытащить списком все слова с дефисом без повторов (GREP preview | Peter Kahrel)
2. Отобрать в нём в отдельный список все правильные.
3. Последовательно пометить их в тексте (цветом, например).
4. Удалить все непомеченные дефисы.
Этот подход может сократить работу. Хотя может и увеличить. Зависит от материала.
 

Jeine

Да здравствует разум! Да сгинет маразм!
Топикстартер
15 лет на форуме
Сообщения
7 310
Реакции
6 315
А что делать с такими радостями, как по-французски, по-современному и т.п.?
Тоже радость: из-за
хотя именно это можно заменить, а потом скопом вернуть только его.
 
Последнее редактирование:

similideus

12 лет на форуме
Сообщения
671
Реакции
349
Это боль, согласен. Я бы начал с проверки орфографии, хотя бы в Ворде или поискал толковый модуль совместимый с Индизайном (ттут где-то тема про Орфо была). Там используются готовые словари. Проверка должна вычистить все "левые" дефисы.
 

dastin

Некромант-любитель
12 лет на форуме
Сообщения
2 146
Реакции
2 043

Jeine

Да здравствует разум! Да сгинет маразм!
Топикстартер
15 лет на форуме
Сообщения
7 310
Реакции
6 315

Jeine

Да здравствует разум! Да сгинет маразм!
Топикстартер
15 лет на форуме
Сообщения
7 310
Реакции
6 315

dastin

Некромант-любитель
12 лет на форуме
Сообщения
2 146
Реакции
2 043
Дичь какая-то получается. Находятся целые куски непонятно почему удовлетворившего запрос текста.
конечно - ведь другого текста не было ...
может так
по-+.*?[\s] ... по- +чего-то там с пробельным элементом на конце - пробел тоже будет выделяться
upload_2018-7-18_19-12-7.png
 

similideus

12 лет на форуме
Сообщения
671
Реакции
349
Проверка или автоматическая замена на верный вариант?
Замена. Возможно не автоматическая. Возможно даже придется добавлять в словарь новые термины. Тут все от забористости исходного текста зависит.

Можно попробовать сделать задом-наперед – удалить все дефисы, а потом пусть "орфография" поставит обратно нужные. :)

Составлять универсальный словарь самому – не быстрее.

Можно копать в сторону такого:
Код:
(?<!По|по)-(?!=|то|либо|нибудь|за|таки)
Но все правила к регулярным выражениям не сведешь, закончится всё проверкой врукопашную.
 
Последнее редактирование:

Jeine

Да здравствует разум! Да сгинет маразм!
Топикстартер
15 лет на форуме
Сообщения
7 310
Реакции
6 315

Jeine

Да здравствует разум! Да сгинет маразм!
Топикстартер
15 лет на форуме
Сообщения
7 310
Реакции
6 315

suntory

Administrator
15 лет на форуме
Сообщения
23 431
Реакции
12 477
Возможно даже придется добавлять в словарь новые термины.
у меня есть сырая программка для борьбы, но она под windows/indesign cs3 (написана на c#). с более новыми версиями InD, боюсь, не будет работать
у меня он есть, изволь
Hyphen Remover
исходник не могу найти :(
вкратце - из текста создается словарь слов с дефисами, ручками отбираешь правильные, они сохраняются на будущее, в остальных дефис убирается
 
Последнее редактирование: