[ID CC-CC2022] Из InDesign в Word

  • Автор темы Автор темы ft5
  • Дата начала Дата начала
ну я думаю если я сам наберу, то это не воспроизведется. давайте idml, посмотрю
 
ну я думаю если я сам наберу, то это не воспроизведется. давайте idml, посмотрю
Да, это, естественно, текст из docx, помещённый для вёрстки в Индизайн. Отправляю примитивный образец аннотации: текст скопирован в Индизайн без сохранения стилей, потом там расставлены неразрывные пробелы и выведен RTF (чудовищный результат также прилагается).

При этом совет @marky по замене всех неразрывных пробелов на обычные пробелы позволяет получить чистый текст, но это (по понятным причинам) тормозит и без того довольно муторный процесс экспорта текста из нескольких десятков файлов.
 

Вложения

Да, конечно, там много разных служебных символов. Но если для вывода номера журнала во всех статьях всё это убивать…
Аналогичная ситуация. Возможно, после sZam'а. Экспортирую в txt (unicode) — исчезают.
 
могу выложить свой вариант скрипта, но он тоже не идеален, потому что обработать все возможные варианты, энтузиазма не хватает
 
  • Спасибо
Реакции: Serbel
Да, это, естественно, текст из docx, помещённый для вёрстки в Индизайн. Отправляю примитивный образец аннотации: текст скопирован в Индизайн без сохранения стилей, потом там расставлены неразрывные пробелы и выведен RTF (чудовищный результат также прилагается).

При этом совет @marky по замене всех неразрывных пробелов на обычные пробелы позволяет получить чистый текст, но это (по понятным причинам) тормозит и без того довольно муторный процесс экспорта текста из нескольких десятков файлов.


ну форматирования тут никакого нет, так что пропадать нечему. а копируется в ворд спокойно. экспорт в RTF тоже ок, хотя если у вас одна Story, то copy/paste imho быстрее
 

Вложения

  • Screen Shot 2021-04-06 at 12.11.32.png
    Screen Shot 2021-04-06 at 12.11.32.png
    120.4 КБ · Просм.: 153
  • export.rtf.zip
    export.rtf.zip
    1.9 КБ · Просм.: 173
Последнее редактирование:
  • Спасибо
Реакции: Serbel
ну форматирования тут никакого нет, так что пропадать нечему. а копируется в ворд спокойно. экспорт в RTF тоже ок, хотя если у вас одна Story, то copy/paste imho быстрее
Очень странно — у меня и при копировании, и при экспорте из отправленного IDML даёт всё тот же результат:
1617709898633.png
 
Было бы интересно посмотреть.
Попробуйте:

Скрипт экспортирует все тексты со страниц документа.
Неразрывный пробел заменяется на обычный.
Белые буквы красятся черным.
Шаблонные страницы не анализируются.

Порядок определяется положением верхнего левого угла текстовых фреймов на странице.
Сначала постранично,
на странице сверху вниз,
если фреймы примерно на одном уровне (до 3 единиц измерения) то слева направо.
Связанные фреймы по первому фрейму в цепочке.
Если цепочка связанных фреймов переходит на другую страницу, то текст рвется по границе абзаца

В результате создается rtf-файл с именем совпадающем с именем indd-файла
 
'hz' в rtf притом сохранились все неразрывные пробелы, я втянул обратно посмотреть - все на месте
 
  • Спасибо
Реакции: Serbel
Попробуйте:

Скрипт экспортирует все тексты со страниц документа.
Неразрывный пробел заменяется на обычный.
Белые буквы красятся черным.
Шаблонные страницы не анализируются.

Порядок определяется положением верхнего левого угла текстовых фреймов на странице.
Сначала постранично,
на странице сверху вниз,
если фреймы примерно на одном уровне (до 3 единиц измерения) то слева направо.
Связанные фреймы по первому фрейму в цепочке.
Если цепочка связанных фреймов переходит на другую страницу, то текст рвется по границе абзаца

В результате создается rtf-файл с именем совпадающем с именем indd-файла
С основным текстом справляется отлично! А вот в сносках остаются всё те же ?????????????????????????, но как решение вопроса с экспортом спусковых полос и списков литературы годится :)
 
Когда я это писал, у меня в файлах не было сносок :-)
Писал же для себя