[ID CC-CC2022] Пропажа диакритки в части текста при импорте в ИнДизайн из Ворда

  • Автор темы Автор темы Dmitrij M
  • Дата начала Дата начала
вот зачем он у тебя в цепочке???
Еще раз опишу:
Если помещать doc/docx, обработанный макросом для присваивания стилей знаков, в ИнДизайн, то, возможны такие глюки:
– присваивание курсива случайным кускам текста (в Ворде все правильно);
– пропажа некоторых сносок вообще или пропажа стилевой разметки в сносках. А в научных публикациях сноски бывают огромными.
Если импортируешь rtf из нормального текста, то все импортируется корректно. Почему так происходит – я не знаю.
 
Жора. вплоть до ИД4 (или 5, я забыл уже) - ртф действительно работал лучше остальных с ИД.

и ноги растут оттуда.

впрочем, у пана без всякого индизайна глючный докс)
 
  • Спасибо
Реакции: Dmitrij M
Димитрий. в данном конкретном случае.

исключи ртф ВООБЩЕ из цепочки (и докс исключи).
все сохранения делай в doc.

и посмотри, что получится)
 
@andrejK, Андрей, так корректно выходит на этом куске текста. Но книга состоит из десятков таких доков. Не проконтролируешь, не пропали ли сноски, нет ли паразитной форматизации, или пропажи форматизации в сносках.
Именно поэтому я и пытаюсь выяснить, что глючит в кусках текста, в которых диакритика может пропасть.
 
ты путаешь, право.

паразитная форматизация есть характеристика докса)

в доке - если таковая происходит - на 100% в палитре character style ты увидишь паразитный стиль символов.
коий надо просто грохнуть без сохранения)))

или при подготовке в ворде - грохнуть все локальные стили с сохранением форматирования.


я настоятельно всё-таки рекомендую отказаться от ртф и докса.
 
  • Спасибо
Реакции: Dmitrij M
У меня макрос
Код:
Sub Unicode()
' Определение Unicode выделенного символа
Char = Selection.Characters(1).Text
MsgBox (AscW(Char))
End Sub
показывает в выделенном тексте почти на всех символах с диакритикой "40" (это открывающая скобка, по-хорошему), а в невыделенном тексте - другие (разные) значения, как и должно быть. И при выделении шрифтом Arial Unicode MS в выделенном тексте меняется вид только буквы ś (на этой букве и AscW показывает не 40, а 347 - как в выделенном, так и в невыделенном тексте), остальные остаются как были:
Unicodes.jpg
Эти символы вставлялись в текст (набирались) одинаково?

И вот интересно, что будет, если я эти символы вставлю копипастом сюда:
łżśńęóć
łżśńęóć
а отсюда уже в Ворд ...
О, случилось чудо: они стали одинаковыми (и шрифтом Georgia).
 
@LeonidB, во. и если ворд не мучать ртф-ом - он таки корректно выдаёт и в ИД эти странные места.
 
  • Спасибо
Реакции: LeonidB
причём - только импортом.

если делать копи-паст в ИД эти странные места - то выходит ...па.
 
При сохранении в rtf в выделенном тексте вообще вся диакритика слетает (за исключением упомянутой ś):
Unicodes-rtf.jpg
 
Эти символы вставлялись в текст (набирались) одинаково?
Эти тексты прошли через несколько пук (опечатка по Фрейду) рук и компов. Происхождение выделенных пока выяснить не удалось. Послан через редакторов запрос автору.
 
Последнее редактирование:
  • Спасибо
Реакции: Dmitrij M и andrejK
  • Спасибо
Реакции: Dmitrij M
ворд умеет много гитик!
 
Может кто-нибудь пощупать этот pdf на предмет кодировки этих двух групп символов?
Хотя, вероятно, Ansi - это вот эти мои <<>>, что я вставил :) А остальное, возможно, в pdf одинаково для обеих групп - то самое Identity-H :)
 
  • Спасибо
Реакции: Dmitrij M
Ворд, это система вёрстки. Ага.
@JAW - молчи!'))'
 
ты про пакет "перестройка" забыл, брат
 

Та ладно... Последний, который была система вёрстки был 2003'й...
Последующие я не осилил, они для каких то идотов сделаны.

А так там жеж понятно, Microsoft почему то считает, что ничего окромя Latin1 нет и не существует.
А если и существует, то это глюк.

Вот отсюда и пляшите :)
 
  • Спасибо
Реакции: langry