[ID CC-CC2022] Пропажа диакритки в части текста при импорте в ИнДизайн из Ворда

  • Автор темы Автор темы Dmitrij M
  • Дата начала Дата начала
@LeonidB, да, пожалуй, макрос – оптимальный выход. Спасибо за наводку, если какие-то знаки не учтены вами – есть кому дописать.
@George, Жора, ты не совсем верно представляешь ситуацию. Есть огромный государственный экономический университет. Тысячи сотрудников, масса зданий, факультетов. Издательство – маленькая административная единица, включенная в сложную иерархию. Книги – большей частью это научные публикации сотрудников или учебники для студентов. Очень малая часть – коммерческие издания. Что либо изменить там невозможно. Кроме языковой редакции есть научная. Эти научные редакторы часто уверены в собственной гениальности, и, что гораздо хуже, стоят сильно выше сотрудников издательства на иерархической лестнице. Взаимодействие с ними крайне осложнено.
Для примера – мне не удалось даже поставить там свое МФУ, чтобы не возить распечатки и сотрудники могли сканировать корректуры и высылать мне. Кто-то из руководства засомневался и запретил во избежание.
 
  • Спасибо
Реакции: Tenebre
Можно попробовать прогнать текст таким макросом
Так чуть короче:
Код:
  unicodes = Array(211, 243, 260, 261, 262, 263, 280, 281, 321, 322, 323, 324, 346, 347, 379, 380)
  For i = 0 To UBound(unicodes)
    ActiveDocument.Content.Find.Execute FindText:=ChrW(unicodes(i)), ReplaceWith:=ChrW(unicodes(i)), Replace:=wdReplaceAll, MatchCase:=True, MatchWildcards:=False
  Next i
 
  • Спасибо
Реакции: LeonidB и Dmitrij M
Позвольте обратить Ваше внимание на то, что предложенные макросы сделают замены только в активном окне (в основном документе исключая сноски, примечания и колонтитулы).
Для обработки всего документа необходимо изменить код макроса:
— либо перебирать все части диапазона (Range, у Вас значится Content)
— либо использовать Selection и в ручную назначать активное окно перед запуском макроса
 
  • Спасибо
Реакции: LeonidB и Dmitrij M
я вот думаю, а если как-то кардинально вообще вопрос решить. docx это xml. разобрать его и перегнать в idml, без таинственных фильтров InD...
 
Эксперименты:
1) Открыл 1.docx в Word 2002 с плагином импорта docx - диакритика в желтых местах улетела
2) Выковырял из 1.docx document.xml
сделал замену
<w:sym w:font="Times New Roman" w:char="00F3"/>
на
<w:t>ó</w:t>

сохранил в UTF-8 (как и было), проследил, чтобы не добавился BOM
засунул document.xml обратно
ó - встали на место (в Word'e 2002)
3) Оба docx у меня импортируются в InDesign (CC 9.2.1 x32) c диакритикой, но данные буквы в выделенных местах оказываются полужирными.
 
  • Спасибо
Реакции: Skvoznyak и Dmitrij M
Вот странно, Ворд все улучшают и обновляют, а работает он теперь просто как всеядная помойка. Через сколько компьютеров пройдет, столько мусора и нацепляет. Если бы он хоть конвертировал каждый раз грамотно. У меня тоже включения то французские, то испанские попадаются, а подчищать приходится ручками.
 
не удивлюсь, что в ворде97 (самом лучшем кстати) - вообще нет таких проблем)))
 

Не по теме:
одна прелестная канадская фирма (плодящая тут икспердов в голубом) -
не только убила лучший верстальный пакет.
но и реального конкурента ворда

 
у меня лично связка docx-ID постоянно глючит.
Хм... Загадка какая-то!.. У меня тексты со множеством сносок (по 3-5 на полосу) в Indesign лучше заливаются именно из .docs...
 
Хм... Загадка какая-то!.. У меня тексты со множеством сносок (по 3-5 на полосу) в Indesign лучше заливаются именно из .docs...
У меня тоже сносок несколько, плюс сноски с переносом, плюс сноски, текст которых больше основного текста на странице, в общем, все фантазии автора... А размещаются через три на четверную. В тексте сами сноски есть, а сносок нет. Или смещаются: вместо сотой сноски - текст сто пятой. Пробовала rtf, пробовала doc - один черт. Ну, ручками...
 
Есть простой способ "санации" Word-овских файлов. Берёте всё, кроме самого последнего знака абзаца, и переносите в чистый Word-файл. Слетят, конечно, настройки формата страниц и всякое другое, но оно вам и не нужно. Полученный новый файл импортируете в InDesign через Place. Помогает избежать массы проблем. Не исключено, что и вам поможет.