[ID CC-CC2019] Из InDesign в Word

Skvoznyak

15 лет на форуме
Сообщения
5 093
Реакции
1 996
ну я думаю если я сам наберу, то это не воспроизведется. давайте idml, посмотрю
 

Serbel

Участник
Сообщения
339
Реакции
84
ну я думаю если я сам наберу, то это не воспроизведется. давайте idml, посмотрю
Да, это, естественно, текст из docx, помещённый для вёрстки в Индизайн. Отправляю примитивный образец аннотации: текст скопирован в Индизайн без сохранения стилей, потом там расставлены неразрывные пробелы и выведен RTF (чудовищный результат также прилагается).

При этом совет @marky по замене всех неразрывных пробелов на обычные пробелы позволяет получить чистый текст, но это (по понятным причинам) тормозит и без того довольно муторный процесс экспорта текста из нескольких десятков файлов.
 

Вложения

  • Образец.zip
    45 КБ · Просм.: 76

Yar

15 лет на форуме
Сообщения
407
Реакции
89
Да, конечно, там много разных служебных символов. Но если для вывода номера журнала во всех статьях всё это убивать…
Аналогичная ситуация. Возможно, после sZam'а. Экспортирую в txt (unicode) — исчезают.
 

afalbert

Участник
Сообщения
92
Реакции
77
могу выложить свой вариант скрипта, но он тоже не идеален, потому что обработать все возможные варианты, энтузиазма не хватает
 
  • Спасибо
Реакции: Serbel

Skvoznyak

15 лет на форуме
Сообщения
5 093
Реакции
1 996
Да, это, естественно, текст из docx, помещённый для вёрстки в Индизайн. Отправляю примитивный образец аннотации: текст скопирован в Индизайн без сохранения стилей, потом там расставлены неразрывные пробелы и выведен RTF (чудовищный результат также прилагается).

При этом совет @marky по замене всех неразрывных пробелов на обычные пробелы позволяет получить чистый текст, но это (по понятным причинам) тормозит и без того довольно муторный процесс экспорта текста из нескольких десятков файлов.


ну форматирования тут никакого нет, так что пропадать нечему. а копируется в ворд спокойно. экспорт в RTF тоже ок, хотя если у вас одна Story, то copy/paste imho быстрее
 

Вложения

  • Screen Shot 2021-04-06 at 12.11.32.png
    Screen Shot 2021-04-06 at 12.11.32.png
    120.4 КБ · Просм.: 49
  • export.rtf.zip
    1.9 КБ · Просм.: 50
Последнее редактирование:
  • Спасибо
Реакции: Serbel

Serbel

Участник
Сообщения
339
Реакции
84
ну форматирования тут никакого нет, так что пропадать нечему. а копируется в ворд спокойно. экспорт в RTF тоже ок, хотя если у вас одна Story, то copy/paste imho быстрее
Очень странно — у меня и при копировании, и при экспорте из отправленного IDML даёт всё тот же результат:
1617709898633.png
 

Skvoznyak

15 лет на форуме
Сообщения
5 093
Реакции
1 996

afalbert

Участник
Сообщения
92
Реакции
77
Было бы интересно посмотреть.
Попробуйте:

Скрипт экспортирует все тексты со страниц документа.
Неразрывный пробел заменяется на обычный.
Белые буквы красятся черным.
Шаблонные страницы не анализируются.

Порядок определяется положением верхнего левого угла текстовых фреймов на странице.
Сначала постранично,
на странице сверху вниз,
если фреймы примерно на одном уровне (до 3 единиц измерения) то слева направо.
Связанные фреймы по первому фрейму в цепочке.
Если цепочка связанных фреймов переходит на другую страницу, то текст рвется по границе абзаца

В результате создается rtf-файл с именем совпадающем с именем indd-файла
 

Skvoznyak

15 лет на форуме
Сообщения
5 093
Реакции
1 996
'hz' в rtf притом сохранились все неразрывные пробелы, я втянул обратно посмотреть - все на месте
 
  • Спасибо
Реакции: Serbel

Serbel

Участник
Сообщения
339
Реакции
84
Попробуйте:

Скрипт экспортирует все тексты со страниц документа.
Неразрывный пробел заменяется на обычный.
Белые буквы красятся черным.
Шаблонные страницы не анализируются.

Порядок определяется положением верхнего левого угла текстовых фреймов на странице.
Сначала постранично,
на странице сверху вниз,
если фреймы примерно на одном уровне (до 3 единиц измерения) то слева направо.
Связанные фреймы по первому фрейму в цепочке.
Если цепочка связанных фреймов переходит на другую страницу, то текст рвется по границе абзаца

В результате создается rtf-файл с именем совпадающем с именем indd-файла
С основным текстом справляется отлично! А вот в сносках остаются всё те же ?????????????????????????, но как решение вопроса с экспортом спусковых полос и списков литературы годится :)
 

afalbert

Участник
Сообщения
92
Реакции
77
Когда я это писал, у меня в файлах не было сносок :)
Писал же для себя