[ID CC2019] Непонятный непечатный символ и GREP

bofi

Топикстартер
12 лет на форуме
Сообщения
113
Оценка реакций
6
Всем добра коллеги.
Столкнулся с таким вопросом.
При переноске текста из ворд, появляются вот такие непечатные символы:
1570806429084.png

При переносе их в поиск GREP они отображаются так: ~I
Где можно узнать информацию по этому символу?

П.С. В Ворде в этих местах ссылки на Главы, типа якоря для переходы в нужное место.
 

Oleg Butrin

15 лет на форуме
Сообщения
1 698
Оценка реакций
949
Отчего же не находится? Вполне ищется и даже заменяется, что позволяет в один поисковый запрос уничтожить весь индекс документа.
 

bofi

Топикстартер
12 лет на форуме
Сообщения
113
Оценка реакций
6
Вот и сам не знаю... просто говорит что нет такого. На работе сделаю гифку, в подтверждение своих слов.
Олег, буду признателен за подсказку, если в курсе где можно почитать про эти "маркеры"?
 

bofi

Топикстартер
12 лет на форуме
Сообщения
113
Оценка реакций
6
Вот об этом говорил. В середине тоже есть маркер и его не отлавливает. Копировал именно его в поиск.

findMarker.gif
 
Последнее редактирование:

Любимцев

12 лет на форуме
Сообщения
2 461
Оценка реакций
1 652
Если автор поставил эти маркеры, значит нужны (во всяком случае, не мешают).
А если вскоре выяснится, что нужен указатель? А вы индексы убили...
 

bofi

Топикстартер
12 лет на форуме
Сообщения
113
Оценка реакций
6
И снова здорова по этой теме :)
Ну вот как то никак не получается составить поиск именно по этому маркеру.
1572859506023.png
Нужно найти:
Начало строки, одну цифру, любой текст до этого маркера.
Мой запросы:
^\d+\. .+(?=~I)
или
^\d+\. .+~I
не отрабатывает. Не могу понять почему.
 

veretragna

γνώσις
Сообщения
351
Оценка реакций
97
Это точно маркер, а не скрытый conditional text?
 

Vadim_PDF

15 лет на форуме
Сообщения
1 598
Оценка реакций
224
Сталкивался с таким - когда приходят из Ворда "битые" индексы (часто из интернета когда копируют документы).
В grep-е у меня не получилось их найти - но они сильно мешали поиску через grep (например когда они стоят в начале строки - не находит (^\d) - начало строки, любая цифра).

Поэтому я их отстреливал (заменял на "ничто" )через обычный текстовый поиск.
Причем поиск по unicode в текстовом поиске (<FEFF>) - работает, а в grep (\x{FEFF}) - нет.

Я их даже в idml искал ковыряя архив. В некоторых случаях они исчезают при экспорте в idml, в некоторых случаях сохраняются причем по-моему с незакрытым тегом, из-за чего и глюк. Тянется года так... 2008 :)


191105_0046.png
 
Последнее редактирование:

_MBK_

Пикирующий бомбардировщик
12 лет на форуме
Сообщения
26 937
Оценка реакций
8 971
Зачем же так деструктивно? INDDrecovery умеет вытаскивать текстовый контент
Я их даже в idml искал ковыряя архив. В некоторых случаях они исчезают при экспорте в idml,
Можно и не так деструктивно - юникодный текст прямо HEX редактором в INDD искать можно и даже (очень осторожно и путем определенных манипуляций) заменять
 

bofi

Топикстартер
12 лет на форуме
Сообщения
113
Оценка реакций
6
Сталкивался с таким - когда приходят из Ворда …
Да, именно от туда.
Для себя тоже "изобрел способ" находить его и заменять на что то, а уже потом делать все остальное.

Что странно, сам по себе он находится. Даже отрабатывает такой вариант: .+~I. Только почему то на двух предыдущих символах.
Вот пример текста.
 

_MBK_

Пикирующий бомбардировщик
12 лет на форуме
Сообщения
26 937
Оценка реакций
8 971