[ID CC-CC2021] Грамотный импорт word-файлов

Статус
Закрыто для дальнейших ответов.

Oleksandr

Участник
Топикстартер
Сообщения
39
Реакции
0
@Oleksandr, именно этим я и занимаюсь. Могу описать алгоритм своих действий...
Большое вам спасибо, в принципе все вышло, хотя есть некоторые нюансы, но так как журнал более волонтерский, чем коммерческий, то некоторые автора попросили еще времени для доработки статей, потому пока перерыв на месяц-два. Вам бы я советовал записать на ютуб видео обработки любой статьи в вашем журнале, уверен, что просмотров будет хоть отбавляй.

Это неплохо общаться на форуме, но для таких как я, которые больше волонтерят, чем этим зарабатывают, лучше один раз увидеть, хотя я и пытаюсь пробраться через профлексику в которой я не живу и только время от времени соприкасаюсь.

Также отдельно хочеться поблагодарить и все ответивших, уверен, что где-то через месяц я опять сюда приду с новыми вопросами, так что не осудите.

Спасибо.
 

Tenebre

10 лет на форуме
Сообщения
500
Реакции
74
@Oleksandr, ммм... не считаю себя крутым специалистом, чтобы выкладывать видео. Мэтры вроде промолчали, значит, криминала в моих действиях не обнаружили. Я не считаю себя профессионалом в верстке, именно потому благодарю всех богов, что как-то случайно напоролась на этот замечательный форум. Хотя тоже не понимаю половины того, что тут пишут.
А вверстать полторы тыщи сносок, как Serbel, - это, я вам скажу, нечто!
 

Oleksandr

Участник
Топикстартер
Сообщения
39
Реакции
0
Появился новый нюанс. Вордовский файл сохраняюв в rtf, далее Ctrl+D копирую в индизайн, обрабатываю DoTextDo, применяю стили и все в основном тексте нормально, но есть нюанс в сносках, на некоторых страницах между ними возникают пробелы, не всегда, но есть места, как от них избавиться, потому что в скрытых символах между ними нет знака пробела, а каждая сноска активна только одна, их, как в ворде, нельзя выделить все сразу и редактировать?
 

LeonidB

Их бин
10 лет на форуме
Сообщения
2 468
Реакции
1 528
каждая сноска активна только одна, их, как в ворде, нельзя выделить все сразу и редактировать?
Весь текст (вместе со сносками) можно выделить в редакторе материалов (меню "Редактирование"). Не уверен, правда, что DoTextOK там сработает без ошибки. Вот sZam умеет там работать.
Это если я правильно понял Ваш вопрос.
 
  • Спасибо
Реакции: Оntario и Oleksandr

andrejK

R.I.P.
Сообщения
10 300
Реакции
5 218
@LeonidB, а может и про это. трудно ванговать по такому изложению.

upload_2017-2-28_22-46-8.png
 
  • Спасибо
Реакции: Валера1966

LeonidB

Их бин
10 лет на форуме
Сообщения
2 468
Реакции
1 528
@andrejK, может, он и про отбивки, конечно. Но в любом случае я сказал, как выделить все сноски скопом - правда, отдельной области для сносок, как к Ворде, тут нет, и выделение распространяется на весь текст, включая сноски. Для обработки sZam'ом, возможно, кому-то это пригодится, даже если ТС говорил о другом. :)
 

Oleksandr

Участник
Топикстартер
Сообщения
39
Реакции
0
Проблема решилась отвязкой сносок от базовых линий, не знаю почему, но между сносками сразу исчезли все невидимые пробелы, которых не было видно нигде, а в опции растояния между сносками стоял "0 мм"
 

Tenebre

10 лет на форуме
Сообщения
500
Реакции
74
Проблема решилась отвязкой сносок от базовых линий, не знаю почему, но между сносками сразу исчезли все невидимые пробелы, которых не было видно нигде, а в опции растояния между сносками стоял "0 мм"

Я к базовым линиям привязываю только базовый текст, а все, что кроме, - нет, шрифт-то меньше используется, очень некрасиво получается.
 

Chaim

חיים ברוך ליברמן
Сообщения
15
Реакции
12
Хочу поделиться работающим вариантом как импортировать текст и не потерять ни сноски, ни другие алфавиты (иврит, греческий), сохранить выделения (болд, италик), избежать неизвестно откуда берущегося болда, в местах где его небыло... Может кому поможет, но для меня лично это решило раз и на всегда все проблемы.
  1. Документ закачиваю на гугл-драйв и потом открываю этот файл через сервис http://docs.google.com
  2. В открывшемся файле выделяю все и копирую cmd﬩A; cmd﬩c
  3. Создаю новый документ в docs.google.com и вставляю cmd﬩v содержимое
  4. Далее в браузерном гугл-редакторе выбираю Файл – Скачать как – Microsoft Word (DOCX)
После пункта 4 (не открывая и не изменяя файл в Word'е) можно импортировать его в InDesign с параметрами "Удалить стили и форматирование..." и галочкой "Сохранить локальную настройку".

Альтернативный путь вместо 4 пункта: (не помню, но для чего-то я его раньше иногда использовал)
4а. Далее в браузерном гугл-редакторе выбираю Файл – Скачать как – Текст в формате rtf
5а. В Word от Microsoft открываю этот скачанный файл и сохраняю его как docx

Вся эта манипуляция помогает затянуть "вордовый" файл в InDesign и не потерять выделения начертаний (болд, италик и тп), а также не потерять сноски. А они кстати в doc теряются, в docx реже. А вот с этой манипуляцией посли долгих экспериментов (после гуглдока) сноски не теряются. Единственный случай когда сноски могут теряться – когда они в таблице, но в моей работе таких случаев практически нет.
Что касается текста без изощрений, то метод уже долгое время радует меня изо дня в день на MacOS. На Windows не работаю, но скорее всего на PC тоже будет работать.
 

Aberdeen

Имя: Павел
15 лет на форуме
Сообщения
561
Реакции
339
@Chaim, огромное Вам спасибо! Первый раз слышу о таком методе, обязательно проверю работу метода на следующем заказе!
 

George

I wish I was a monster you think I am
15 лет на форуме
Сообщения
17 301
Реакции
7 864
@Chaim, Таки это из области фантастики :) Имхо проще в ворде сохранить как rtf. Или не?
 

RIKITIKI

20 лет на форуме
Сообщения
1 465
Реакции
515
Имхо проще в ворде сохранить как rtf. Или не?
Нет гарантий... А вот воспользоваться упомянутым скриптом Михаила Иванюшина ничто не мешает и работает надёжно. Тем более доработан не так давно совместными усилиями Иванюшина-Кащеева
 

Oleg Butrin

20 лет на форуме
Сообщения
1 989
Реакции
1 213
Удивительно, что две гигантских софтверных компании годами не могут состыковать свои программные продукты так, чтобы импорт работал без проблем.
 

RIKITIKI

20 лет на форуме
Сообщения
1 465
Реакции
515
Может потому что гигантские?
 

Chaim

חיים ברוך ליברמן
Сообщения
15
Реакции
12
@Chaim, Таки это из области фантастики :) Имхо проще в ворде сохранить как rtf. Или не?
Когда в тексте есть выделения, сноски (а у меня еще и смесь иврита и кириллицы почти в каждой книге) и тп, когда с файлом работают по многу человек и в разных версиях пересохраняют сотни раз (посмотреть на внутренности такого файла – можно испугаться сколько там лишнего) – rtf не спасает.

А вот воспользоваться упомянутым скриптом Михаила Иванюшина ничто не мешает и работает надёжно.
Без этого просто никуда. + кавычки )). Но dotextok никак не поможет вернуть правильные выделения и пропавшие сноски после импорта. Скрипт уже после "чистит" и приводит в порядок импортированный текст. Кстати Михаил в вышеприведенном видео упоминает мой метод, и опять же подчеркивает что он, цитирую "безупречно работает на Макинтошах", а вот на PC не знаю
 

RIKITIKI

20 лет на форуме
Сообщения
1 465
Реакции
515
никак не поможет вернуть правильные выделения и пропавшие сноски после импорта
поможет не потерять выделения, есть там такие возможности. А про сноски у него другой скрипт - тоже не потеряются
 

Oleg Butrin

20 лет на форуме
Сообщения
1 989
Реакции
1 213
Может потому что гигантские?
Затрудняюсь объяснить причину.

Не по теме:
Недавно с удивлением узнал, что O’Reilly Media для исходных текстов использует формат Markdown. Потом подумал, и понял, что так намного надежнее получится, если обучить авторов и наборщиков хотя бы начальному уровню.
 

Chaim

חיים ברוך ליברמן
Сообщения
15
Реакции
12
@Chaim,
поможет не потерять выделения, есть там такие возможности. А про сноски у него другой скрипт - тоже не потеряются
Мы может о разном говорим. DoTextOk может уже после импорта обработать текст, показать, к примеру, "потерянные кавычки", шпации расставить, сделать символьные стили для выделений... Но я же говорю о том что (в моей работе) много файлов в ворде, которые приходят в верстку с выделениями, которые попросту сразу после импорта теряются в разных местах, либо появляется болд там, где его никогда небыло и пр странности, не говоря уже о сносках.
Прогнать файл через гугл-док – самое быстрое и безболезненное для файла что я пока пробовал, в том числе и учитывая такие мысли Михаила Иванюшина, как:
 
Статус
Закрыто для дальнейших ответов.