[ID CC-CC2022] Грамотный импорт word-файлов

  • Автор темы Автор темы Oleksandr
  • Дата начала Дата начала
Статус
Закрыто для дальнейших ответов.

Oleksandr

Участник
Топикстартер
Сообщения
39
Реакции
0
Здравствуйте.

Очень хотелось, чтобы вы подсказали, где найти информацию о правильном переносе даных с ворда в индизайн. Дело в том, что сейчас я верстаю журнал, где основное наполнение - это научные статьи с ссылками, библиографией, в самом тексте тоже есть достаточно моментов (курсив, разный кегль, разрядка...), которые трудно перенести.

Перенос ссылок в принципе нормальный, ничего не теряется, авторы со стилями в ворде не работают, потому и перенести нечего. Ссылки в индизайне переносятся каждая отдельно, т. е. не выделяются все сразу. Не очень хочеться делать все в ручную.

Я много читал про стили, научился их делать, но вот как грамотно перенести текст с ворда, я информации не нашел. Если вы знаете такое видео, статью, тему на форуме, буду вам очень признателен.
 
Заявления
авторы со стилями в ворде не работают, потому и перенести нечего.
и одновременно
Я много читал про стили, научился их делать, но вот как грамотно перенести их с ворда,
являются когнитивным диссонансом.
 
Я имел ввиду, что когда я столкнулся с этой проблемой, то много нашел информации о создании стилей в ворде, которые можна перенести в индизайн, но автора журнала со стилями не работают, потому по факту есть просто вордовский файл, в котором есть сноски и т.д., но я не могу весь масив текста корректно перенести в индизайн.
 
Пробовал, но как-то коряво выходит.

Вот ссылка на одну из работ, может я что-то не то делаю, но когда надо изменить шрифт текста на журнальный, сохраняя все авторские моменты, это сложно.

Текс для переноса в индизайн
 
Вот ссылка на одну из работ, может я что-то не то делаю, но когда надо изменить шрифт текста на журнальный, сохраняя все авторские моменты, это сложно.
Если "авторские моменты" - это выделения типа курсива или полужирного (и они "слетают" при присвоении индизайновских стилей) - попробуйте DoTextOk. Скрипт имеет массу полезных функций по обработке импортированного текста.
 
  • Спасибо
Реакции: Oleksandr
@Oleksandr, при импорте текста нажмите галку:
import-1.jpg
и поэкспериментируйте тут:
import-2.jpg
Сами увидите, что Вам больше подойдёт и понравится.
Понравившийся вариант сохраните в виде пресета и назначьте его по умолчанию (можно отдельно для doc и для rtf). Потом галочку показа опций при импорте можно снять: doc и rtf будут импортироваться с установками по умолчанию.
 
Если в журнале нет тонны странных выделений типа надстрочная зачёркнутая капитель (у меня вот и не такое бывает), то достаточно создать следующие символьные стили:
  • Times italic;
  • Times bold;
  • Times bold italic;
  • Times капитель;
  • знак сноски;
  • любые другие регулярные выделения, если они, не дай бог, есть (как пример не самой страшной ситуации см. скриншот).
После этого применить их аккуратно любым удобным способом, да хоть бы даже поиском-заменой. Только осторожно. То есть в поиске не забыть указать также то, чем искомое не является «Times, курсив, не надстрочный, не подстрочный, не зачёркнутый, не капитель». После этого вы будете застрахованы от overrides в большинстве абзацев, а остальное отлавливается в процессе.
 

Вложения

  • стили.gif
    стили.gif
    18.4 КБ · Просм.: 1 343
Что до сносок, то старинный метод утверждает, что надо прописную кириллическую букву «К» заменить в Ворде на любой уникальный символ (я беру ▲), после чего в большинстве случаев (с редкими исключениями) импорт файла в формате .doc в Индизайн проходит без проблем со слетающими сносками.
Конвертация в .rtf не панацея — у меня несколько раз нестандартные символы превращались из-за этого в кириллицу.
Ещё полезный способ, который меня дважды спасал в ситуации с особенно чудовищными оригиналами, — сконвертировать .doc в .docx, а потом обратно в .doc.
 
Если в журнале нет тонны странных выделений типа надстрочная зачёркнутая капитель (у меня вот и не такое бывает), то достаточно создать следующие символьные стили:
  • Times italic;
  • Times bold;
  • Times bold italic;
  • Times капитель;
  • знак сноски;
  • любые другие регулярные выделения, если они, не дай бог, есть (как пример не самой страшной ситуации см. скриншот).
После этого применить их аккуратно любым удобным способом, да хоть бы даже поиском-заменой. Только осторожно. То есть в поиске не забыть указать также то, чем искомое не является «Times, курсив, не надстрочный, не подстрочный, не зачёркнутый, не капитель». После этого вы будете застрахованы от overrides в большинстве абзацев, а остальное отлавливается в процессе.
DoTextOk делает это все автоматически прямо в ИнДизайне.
 
  • Спасибо
Реакции: Валера1966 и LeonidB
DoTextOk делает это все автоматически прямо в ИнДизайне.
Он сделает подстрочную полужирную курсивную капитель?

Я на скрипт этот некогда смотрел, но не нашёл для себя каких-то решающих преимуществ, мне как-то спокойнее, когда я точно знаю, что я заменяю на что.
 
Он сделает подстрочную полужирную курсивную капитель?

Я на скрипт этот некогда смотрел, но не нашёл для себя каких-то решающих преимуществ, мне как-то спокойнее, когда я точно знаю, что я заменяю на что.

скрипт от Jongware точно сделает
https://indesignsecrets.com/perfectpreptext-a-smart-way-to-style-local-formatting.php
 
хоть бы даже поиском-заменой
Если в окне поиска-замены Индизайна сохранить поисковые запросы, то в DoTextOk (на последней вкладке) можно задать в нужном порядке те замены, которые будут отрабатываться при обработке текста данным набором установок.
 
  • Спасибо
Реакции: Валера1966 и Serbel
@Oleksandr, именно этим я и занимаюсь. Могу описать алгоритм своих действий (может, неправильный, мэтры подскажут).
Обрабатывается текст в ворде, убираются по мере возможности все 135 стилей (знак, знак знак знак и так далее). Все выделения сохраняются. Картинки складываются в общую для журнала папочку. Таблицы тоже. Формулы делаются в МТ и экспортируются средствами МТ, в тексте остаются только теги (если я их правильно обзываю). Подрисуночные подписи остаются в конце статьи. Текст сохраняется в rtf (авторы у нас фантазеры, лучше уж так), но остается и doc.
А дальше уже ИД. Ctrl +D с нажатым шифтом, потом Dotext, потом назначение всему тексту общего стиля, замена тегов на формулы, потом уже обработка. У нас журнал двухколоночный, поэтому для метаданных другой фрейм (в библиотеке складирован), стили для каждого фрагмента (УДК, название, авторы, аффиляция, аннотация, ключевые слова, DOI). Вставка на место рисунков, фрейм для подрисуночной - из библиотеки, подписи перетаскиванием из конца статьи, вставка на место таблиц, их обработка стилями (хотя раньше я их готовила в ворде и помещала с сохранением стилей, но мне объяснили, что это некошерно). Все выделения в тексте сохраняются.
На верстку 120-140 страниц уходит не более трех дней, если только формулы не с русскими символами, которые приходится картинками вставлять, но это сложно, если их не 5, а 55. Дополню тем, что у меня на 5 страниц текста может быть 6 разномасштабных иллюстраций, вот и приходится, простите, впихивать невпихуемое, соблюдая баланс колонок, привязи к базовым линиям и по мере слабых сил своих - размещение рисунков и таблиц после ссылок на них в тексте.
(В надежде, что и мне попутно скажут, что я делаю не так...)
 
Последнее редактирование:
Что до сносок, то старинный метод утверждает, что надо прописную кириллическую букву «К» заменить в Ворде на любой уникальный символ (я беру ▲), после чего в большинстве случаев (с редкими исключениями) импорт файла в формате .doc в Индизайн проходит без проблем со слетающими сносками.
Конвертация в .rtf не панацея — у меня несколько раз нестандартные символы превращались из-за этого в кириллицу.
Ещё полезный способ, который меня дважды спасал в ситуации с особенно чудовищными оригиналами, — сконвертировать .doc в .docx, а потом обратно в .doc.
Удивительно, но у меня всего пару раз были проблемы со сносками, но исключительно в силу альтернативности автора, который умудрился оооочень криво их сделать.
Вне журнала (то есть в других верстках) у меня бывало до 300 сносок, причем некоторые занимали суммарно полторы страницы текста (!).
 
Со сносками у меня самым наилучшим образом обрабатывается файл .docx. Именно такой формат, а не .doc, при втягивании которого сноски даже теряются.
 
Но .docx тоже изредка портит те или иные параметры.
Короче, панацеи нет, однако наиболее толковые способы в этой теме перечислены, так что у автора довольно широкий выбор, как наладить свою работу.


Не по теме:
Вне журнала (то есть в других верстках) у меня бывало до 300 сносок, причем некоторые занимали суммарно полторы страницы текста (!).
Ну, если хвастаться, у меня была как-то раз сноска длиной в 5 страниц. При этом всего в книге итоговым объёмом в 300 страниц была 1451 сноска.

 
Статус
Закрыто для дальнейших ответов.