[ID CC-CC2022] Грамотный импорт word-файлов

  • Автор темы Автор темы Oleksandr
  • Дата начала Дата начала
Статус
Закрыто для дальнейших ответов.
@Oleksandr, именно этим я и занимаюсь. Могу описать алгоритм своих действий...
Большое вам спасибо, в принципе все вышло, хотя есть некоторые нюансы, но так как журнал более волонтерский, чем коммерческий, то некоторые автора попросили еще времени для доработки статей, потому пока перерыв на месяц-два. Вам бы я советовал записать на ютуб видео обработки любой статьи в вашем журнале, уверен, что просмотров будет хоть отбавляй.

Это неплохо общаться на форуме, но для таких как я, которые больше волонтерят, чем этим зарабатывают, лучше один раз увидеть, хотя я и пытаюсь пробраться через профлексику в которой я не живу и только время от времени соприкасаюсь.

Также отдельно хочеться поблагодарить и все ответивших, уверен, что где-то через месяц я опять сюда приду с новыми вопросами, так что не осудите.

Спасибо.
 
@Oleksandr, ммм... не считаю себя крутым специалистом, чтобы выкладывать видео. Мэтры вроде промолчали, значит, криминала в моих действиях не обнаружили. Я не считаю себя профессионалом в верстке, именно потому благодарю всех богов, что как-то случайно напоролась на этот замечательный форум. Хотя тоже не понимаю половины того, что тут пишут.
А вверстать полторы тыщи сносок, как Serbel, - это, я вам скажу, нечто!
 
Появился новый нюанс. Вордовский файл сохраняюв в rtf, далее Ctrl+D копирую в индизайн, обрабатываю DoTextDo, применяю стили и все в основном тексте нормально, но есть нюанс в сносках, на некоторых страницах между ними возникают пробелы, не всегда, но есть места, как от них избавиться, потому что в скрытых символах между ними нет знака пробела, а каждая сноска активна только одна, их, как в ворде, нельзя выделить все сразу и редактировать?
 
каждая сноска активна только одна, их, как в ворде, нельзя выделить все сразу и редактировать?
Весь текст (вместе со сносками) можно выделить в редакторе материалов (меню "Редактирование"). Не уверен, правда, что DoTextOK там сработает без ошибки. Вот sZam умеет там работать.
Это если я правильно понял Ваш вопрос.
 
  • Спасибо
Реакции: Оntario и Oleksandr
@LeonidB, а может и про это. трудно ванговать по такому изложению.

upload_2017-2-28_22-46-8.png
 
  • Спасибо
Реакции: Валера1966
@andrejK, может, он и про отбивки, конечно. Но в любом случае я сказал, как выделить все сноски скопом - правда, отдельной области для сносок, как к Ворде, тут нет, и выделение распространяется на весь текст, включая сноски. Для обработки sZam'ом, возможно, кому-то это пригодится, даже если ТС говорил о другом. :)
 
Проблема решилась отвязкой сносок от базовых линий, не знаю почему, но между сносками сразу исчезли все невидимые пробелы, которых не было видно нигде, а в опции растояния между сносками стоял "0 мм"
 
Проблема решилась отвязкой сносок от базовых линий, не знаю почему, но между сносками сразу исчезли все невидимые пробелы, которых не было видно нигде, а в опции растояния между сносками стоял "0 мм"

Я к базовым линиям привязываю только базовый текст, а все, что кроме, - нет, шрифт-то меньше используется, очень некрасиво получается.
 
Хочу поделиться работающим вариантом как импортировать текст и не потерять ни сноски, ни другие алфавиты (иврит, греческий), сохранить выделения (болд, италик), избежать неизвестно откуда берущегося болда, в местах где его небыло... Может кому поможет, но для меня лично это решило раз и на всегда все проблемы.
  1. Документ закачиваю на гугл-драйв и потом открываю этот файл через сервис http://docs.google.com
  2. В открывшемся файле выделяю все и копирую cmd﬩A; cmd﬩c
  3. Создаю новый документ в docs.google.com и вставляю cmd﬩v содержимое
  4. Далее в браузерном гугл-редакторе выбираю Файл – Скачать как – Microsoft Word (DOCX)
После пункта 4 (не открывая и не изменяя файл в Word'е) можно импортировать его в InDesign с параметрами "Удалить стили и форматирование..." и галочкой "Сохранить локальную настройку".

Альтернативный путь вместо 4 пункта: (не помню, но для чего-то я его раньше иногда использовал)
4а. Далее в браузерном гугл-редакторе выбираю Файл – Скачать как – Текст в формате rtf
5а. В Word от Microsoft открываю этот скачанный файл и сохраняю его как docx

Вся эта манипуляция помогает затянуть "вордовый" файл в InDesign и не потерять выделения начертаний (болд, италик и тп), а также не потерять сноски. А они кстати в doc теряются, в docx реже. А вот с этой манипуляцией посли долгих экспериментов (после гуглдока) сноски не теряются. Единственный случай когда сноски могут теряться – когда они в таблице, но в моей работе таких случаев практически нет.
Что касается текста без изощрений, то метод уже долгое время радует меня изо дня в день на MacOS. На Windows не работаю, но скорее всего на PC тоже будет работать.
 
@Chaim, огромное Вам спасибо! Первый раз слышу о таком методе, обязательно проверю работу метода на следующем заказе!
 
@Chaim, Таки это из области фантастики :) Имхо проще в ворде сохранить как rtf. Или не?
 
Имхо проще в ворде сохранить как rtf. Или не?
Нет гарантий... А вот воспользоваться упомянутым скриптом Михаила Иванюшина ничто не мешает и работает надёжно. Тем более доработан не так давно совместными усилиями Иванюшина-Кащеева
 
Удивительно, что две гигантских софтверных компании годами не могут состыковать свои программные продукты так, чтобы импорт работал без проблем.
 
Может потому что гигантские?
 
@Chaim, Таки это из области фантастики :) Имхо проще в ворде сохранить как rtf. Или не?
Когда в тексте есть выделения, сноски (а у меня еще и смесь иврита и кириллицы почти в каждой книге) и тп, когда с файлом работают по многу человек и в разных версиях пересохраняют сотни раз (посмотреть на внутренности такого файла – можно испугаться сколько там лишнего) – rtf не спасает.

А вот воспользоваться упомянутым скриптом Михаила Иванюшина ничто не мешает и работает надёжно.
Без этого просто никуда. + кавычки )). Но dotextok никак не поможет вернуть правильные выделения и пропавшие сноски после импорта. Скрипт уже после "чистит" и приводит в порядок импортированный текст. Кстати Михаил в вышеприведенном видео упоминает мой метод, и опять же подчеркивает что он, цитирую "безупречно работает на Макинтошах", а вот на PC не знаю
 
никак не поможет вернуть правильные выделения и пропавшие сноски после импорта
поможет не потерять выделения, есть там такие возможности. А про сноски у него другой скрипт - тоже не потеряются
 
Может потому что гигантские?
Затрудняюсь объяснить причину.

Не по теме:
Недавно с удивлением узнал, что O’Reilly Media для исходных текстов использует формат Markdown. Потом подумал, и понял, что так намного надежнее получится, если обучить авторов и наборщиков хотя бы начальному уровню.
 
@Chaim,
поможет не потерять выделения, есть там такие возможности. А про сноски у него другой скрипт - тоже не потеряются
Мы может о разном говорим. DoTextOk может уже после импорта обработать текст, показать, к примеру, "потерянные кавычки", шпации расставить, сделать символьные стили для выделений... Но я же говорю о том что (в моей работе) много файлов в ворде, которые приходят в верстку с выделениями, которые попросту сразу после импорта теряются в разных местах, либо появляется болд там, где его никогда небыло и пр странности, не говоря уже о сносках.
Прогнать файл через гугл-док – самое быстрое и безболезненное для файла что я пока пробовал, в том числе и учитывая такие мысли Михаила Иванюшина, как:

 
Статус
Закрыто для дальнейших ответов.