Друзья, помогите разобраться с *doc.

У ТС глючит rtf, c этого тема и началась.

Слушайте, а у Вас часто слетает локальное форматирование при помещении файлов в ИнДизайн?
Один раз слетало.
Это был сборник научных статей. С момента основания файл явно перебывал на 20-30 компьютерах всех систем и цветов радуги.
Это был тихий ужас. Поскольку пришлось копировать в Блокнот, оттуда голый текст в Индизайн. И, поглядывая на документ Ворда, где встречались, например, наклонные латинские буквы или индексы в нижнем/верхнем регистре, приводить к исходному виду. Некоторые символы при этом изображались как розовые перечёркнутые прямоугольники. Надо было или в этой гарнитуре, или в другой найти подходящие символы и вставить... Десятки раз...
Вот, вспомнил: например, буква "е" или "о" с умляутом "ударение слева сбоку". Или она же, только "...справа сбоку".
 
Последнее редактирование:
Текст после вставки через *.rtf в некоторых местах пропадал кусками буквально внутри слов.
Тот файл от всей дущи глюков наловил за свою многострадальную жизнь, шастая по операционкам и версиям Ворда.
 
Жалко, что нельзя сделать в вордовском файле "прогон через idml".
У меня пропадает только в docx, но я давно это заметила и не использую этот формат для помещения файлов.
 
Стоп-стоп-стоп. Я окончательно запуталась.
Почему в ворде видно, где заголовок, а где курсив, а в Индизайне нет?
На каком этапе пропадает разметка?
Только что попробовал импортировать одностраничный doc со спецификацией. Классический случай - все одним стилем. Выравнивание текста и отступы от края страницы сохранились. Отступы перед и после абзаца причесались под один образец. "Жирный" пропал почти всюду, сохранился только в таблице. Курсив и надстрочный индекс сохранились не везде.
Видя такое, я уже не доверяю этому форматированию
 
  • Спасибо
Реакции: langry
Только что попробовал импортировать одностраничный doc со спецификацией. Классический случай - все одним стилем. Выравнивание текста и отступы от края страницы сохранились. Отступы перед и после абзаца причесались под один образец. "Жирный" пропал почти всюду, сохранился только в таблице. Курсив и надстрочный индекс сохранились не везде.
Видя такое, я уже не доверяю этому форматированию
А если этот же файл сохранить в rtf?

Все больше удивляюсь, как меня за столько лет такие проблемы обходили стороной. Всё же фартовая.
 
А если этот же файл сохранить в rtf?

Все больше удивляюсь, как меня за столько лет такие проблемы обходили стороной. Всё же фартовая.
С rtf стало намного бодрее, почти все перенеслось. Только отступы перед и после абзаца сбились
 
В общем, суть - если я не уверен, что все перенеслось правильно, мне проще разметить исходник нормально, чем потом приводить импортированный текст в соответствие с исходником, особенно, если страниц больше 20. Не хочу оставлять себе ни малейшего шанса на ошибку
 
А я собственными ручками убиваю и так все отступы, потому что у меня свои заложены в абзацных стилях и паразитные из Ворда только мешают. Поэтому ctrl + A и всё по нулям.

И ещё вопросец: а если в файле doc всё разметить стилями, то потом не слетит?

Не по теме:
Блин, но это же столько ручной скучной работы.
 
Быстро попробовал это провернуть на двух абзацах - ничего не слетело.
Да ладно, там ручной работы столько же, сколько в индизе - создать болванки стилей и прощелкать абзацы в ворде занимает столько же времени, сколько в индизе. Тем более, болванка стиля создается из тех атрибутов, которые применены сейчас к абзацу в ворде. А дальше дело техники - создать стили в индизе и настроить маппинг стилей, это достаточно быстро
 
Я не помню можно ли в ворде цеплять хоткеи на стили. Но с ними получается уже быстрее. Плюс у ИнДизайна сильно лучше GREP, поэтому там автоматом можно сделать довольно хитрые замены. Ну и тот же бесплатный DoTextOK любезно сам конвертит все отдельные выделения в символьные стили, что ещё упрощает работу.

Я несколько лет назад верстала в Ворде, так нужно было заказчику. И достаточно насладилась его функционалом для этих целей. Больше не особо тянет. Тогда разметка стилями меня там совсем не впечатлила. И всё ещё кажется более трудоемкой, чем в ИнДизайне.

Ну и я всё же настоятельно рекомендую помещать в верстку rtf. Пусть немножко староверно, но проверено опытом.
 
'fp'
Удаляем стиль и присваиваем стиль ИД
Это если в ворде изначально были какие-то стили и у документа была структура.
Если структуры нет и маппинг не настроен, импортируется ровно один стиль абзаца
2019-06-21_161732.png
 
Это как раз регулярная картина. Normal, Normal (web), Основной и Заголовок 1. Я уже с ними прямо сроднилась)))) Каждый раз их наблюдаю. Но в тексте-то всё равно полно локального форматирования и от этого уже можно плясать.

Ну ленивая я, не люблю делать руками ничего, что можно заставить делать комп за меня)))))))))))))
 
Я не помню можно ли в ворде цеплять хоткеи на стили. Но с ними получается уже быстрее. Плюс у ИнДизайна сильно лучше GREP, поэтому там автоматом можно сделать довольно хитрые замены. Ну и тот же бесплатный DoTextOK любезно сам конвертит все отдельные выделения в символьные стили, что ещё упрощает работу.

Я несколько лет назад верстала в Ворде, так нужно было заказчику. И достаточно насладилась его функционалом для этих целей. Больше не особо тянет. Тогда разметка стилями меня там совсем не впечатлила. И всё ещё кажется более трудоемкой, чем в ИнДизайне.

Ну и я всё же настоятельно рекомендую помещать в верстку rtf. Пусть немножко староверно, но проверено опытом.
Область применимости грепа можно вывести, если уже понятно, с чем работаешь) Бывает, сразу видишь документ и понятно, что тут грепом можно полуавтоматически форматировать, а бывает так, что в макете заказчика полная чушь намешана.
Вопрос в том, на что тратится больше времени - на форматирование ворда или на приведение макета в индизе в соответствие с вордом. Замеряю затраты времени при случае, если не забуду
 
Всюду есть нюансы - если текст в ворде сделан не в классическом flow, а блоками-надписями, объем ручной работы резко растет, тут я уже бы задумался, а стоит ли форматировать ворд в принципе.
Короче, в каждом случае надо смотреть, что легче и выгоднее по времени. У меня серьезный опыт импорта неструктурированных вордовских файлов был только в 1 проекте на ~600 страниц. Там я сначала импортировал "как есть", но потом начал заново с форматированием ворда как раз из-за того, что очень много проверок приходилось проводить, а у заказчика были жесткие требования по качеству.
 
Я Ваши опасения могу понять, но когда только начинаю думать о расстановке стилей в ворде, ещё и, не дай бог, ручной, то у меня дёргается левый глазик чуть-чуть.
Мои исходники часто имеют какой-то такой вид (там будет мои любимые 3-4 стиля в ворде):
1561128486438.png1561128504832.png

И размечать это всё в ворде я морально не готова.
Кстати, при всём многообразии форматирования (а там и разрядка, и ещё где-то подчеркивания пробегали) у меня ничего не слетает, тут это недопустимо и корректор бы сразу заметил.
Поэтому всё равно буду скорее против советов тратить дополнительное время на работу в ворде просто для подстраховки.
 
Очевидно, с разным опытом проявляется склонность к разным методам. Предлагаю сойтись на том, что нужно смотреть по ситуации.