[ID CC-CC2021] Из InDesign в Word

Skvoznyak

15 лет на форуме
Сообщения
5 500
Реакции
2 168
ну я думаю если я сам наберу, то это не воспроизведется. давайте idml, посмотрю
 

Serbel

Участник
Сообщения
376
Реакции
88
ну я думаю если я сам наберу, то это не воспроизведется. давайте idml, посмотрю
Да, это, естественно, текст из docx, помещённый для вёрстки в Индизайн. Отправляю примитивный образец аннотации: текст скопирован в Индизайн без сохранения стилей, потом там расставлены неразрывные пробелы и выведен RTF (чудовищный результат также прилагается).

При этом совет @marky по замене всех неразрывных пробелов на обычные пробелы позволяет получить чистый текст, но это (по понятным причинам) тормозит и без того довольно муторный процесс экспорта текста из нескольких десятков файлов.
 

Вложения

  • Образец.zip
    45 КБ · Просм.: 148

Yar

15 лет на форуме
Сообщения
518
Реакции
156
Да, конечно, там много разных служебных символов. Но если для вывода номера журнала во всех статьях всё это убивать…
Аналогичная ситуация. Возможно, после sZam'а. Экспортирую в txt (unicode) — исчезают.
 

afalbert

10 лет на форуме
Сообщения
120
Реакции
88
могу выложить свой вариант скрипта, но он тоже не идеален, потому что обработать все возможные варианты, энтузиазма не хватает
 
  • Спасибо
Реакции: Serbel

Skvoznyak

15 лет на форуме
Сообщения
5 500
Реакции
2 168
Да, это, естественно, текст из docx, помещённый для вёрстки в Индизайн. Отправляю примитивный образец аннотации: текст скопирован в Индизайн без сохранения стилей, потом там расставлены неразрывные пробелы и выведен RTF (чудовищный результат также прилагается).

При этом совет @marky по замене всех неразрывных пробелов на обычные пробелы позволяет получить чистый текст, но это (по понятным причинам) тормозит и без того довольно муторный процесс экспорта текста из нескольких десятков файлов.


ну форматирования тут никакого нет, так что пропадать нечему. а копируется в ворд спокойно. экспорт в RTF тоже ок, хотя если у вас одна Story, то copy/paste imho быстрее
 

Вложения

  • Screen Shot 2021-04-06 at 12.11.32.png
    Screen Shot 2021-04-06 at 12.11.32.png
    120.4 КБ · Просм.: 127
  • export.rtf.zip
    1.9 КБ · Просм.: 134
Последнее редактирование:
  • Спасибо
Реакции: Serbel

Serbel

Участник
Сообщения
376
Реакции
88
ну форматирования тут никакого нет, так что пропадать нечему. а копируется в ворд спокойно. экспорт в RTF тоже ок, хотя если у вас одна Story, то copy/paste imho быстрее
Очень странно — у меня и при копировании, и при экспорте из отправленного IDML даёт всё тот же результат:
1617709898633.png
 

Skvoznyak

15 лет на форуме
Сообщения
5 500
Реакции
2 168

afalbert

10 лет на форуме
Сообщения
120
Реакции
88
Было бы интересно посмотреть.
Попробуйте:

Скрипт экспортирует все тексты со страниц документа.
Неразрывный пробел заменяется на обычный.
Белые буквы красятся черным.
Шаблонные страницы не анализируются.

Порядок определяется положением верхнего левого угла текстовых фреймов на странице.
Сначала постранично,
на странице сверху вниз,
если фреймы примерно на одном уровне (до 3 единиц измерения) то слева направо.
Связанные фреймы по первому фрейму в цепочке.
Если цепочка связанных фреймов переходит на другую страницу, то текст рвется по границе абзаца

В результате создается rtf-файл с именем совпадающем с именем indd-файла
 

Skvoznyak

15 лет на форуме
Сообщения
5 500
Реакции
2 168
'hz' в rtf притом сохранились все неразрывные пробелы, я втянул обратно посмотреть - все на месте
 
  • Спасибо
Реакции: Serbel

Serbel

Участник
Сообщения
376
Реакции
88
Попробуйте:

Скрипт экспортирует все тексты со страниц документа.
Неразрывный пробел заменяется на обычный.
Белые буквы красятся черным.
Шаблонные страницы не анализируются.

Порядок определяется положением верхнего левого угла текстовых фреймов на странице.
Сначала постранично,
на странице сверху вниз,
если фреймы примерно на одном уровне (до 3 единиц измерения) то слева направо.
Связанные фреймы по первому фрейму в цепочке.
Если цепочка связанных фреймов переходит на другую страницу, то текст рвется по границе абзаца

В результате создается rtf-файл с именем совпадающем с именем indd-файла
С основным текстом справляется отлично! А вот в сносках остаются всё те же ?????????????????????????, но как решение вопроса с экспортом спусковых полос и списков литературы годится :)
 

afalbert

10 лет на форуме
Сообщения
120
Реакции
88
Когда я это писал, у меня в файлах не было сносок :)
Писал же для себя