[ID CC-CC2022] Есть ли мысли про глобальную предразметку текста?

hulk1776

Топикстартер
15 лет на форуме
Сообщения
738
Реакции
21
Интересно, есть ли какие-то идеи насчет создания разметки текста (по аналогии с HTML-тегами), чтобы при вставке в верстку оно сразу бы принимало нужные стили, кегли и остальное. Как-nj в Пижамкере это пробовал. На выходе все замечательно, - мгновенное оформление всего макета. Но расстановка такой разметки занимает столько же времени, сколько и сама верстка. Нет ли мыслей по реализации этой идеи, или где пошукать на эту тему?
 
а чем обычные стили не устраивают..?
 
Издательство O'Reilly, говорят, использует для набора текстов несколько оптимизированный формат Markdown.
 
Я когда-то сделал и долго использовал макрос, который в вордовском файле расставлял теги для последующего импорта в Кварк. Но там у меня тегировались только начертания, подчёркивания, мягкие переносы и разного рода шпации (может, что-то ещё по мелочи, типа ударений), а до разметки стилей я не дошёл, поскольку приходящие тексты были сделаны, как правило, людьми, о стилях представления не имевшими (или имевшими, но очень извращённое). И смысла переделывать в Ворде то, что я мог сделать и в вёрстке, не было. Вот если б все приходящие материалы были сделаны на основе одного шаблона и авторы (редакторы) строго бы придерживались стилевой разметки этого шаблона, - тогда бы смысл, возможно, был.
 
был когда-то такой конвертер XTG XTG 13 Сначала пользовал под QuarkXPress, потом адаптировал под InDesign.... давно заброшен, но работает в принципе. Плюс наборы замен, чистка текста, очень гибко.... лет 12 назад было дело Яндекс.Картинки
 
  • Спасибо
Реакции: Petruccio
Но расстановка такой разметки занимает столько же времени, сколько и сама верстка.
А как себе представляется альтернатива? Вот есть некий неформатированный TXT. В итоге хочется получить тэгированный текст, который при импорте в программу верстки самооформится. Как волшебный тэгогенератор узнает, где и какой тэг ставить?

Я участвовал в решении похожей проблемы, но там был более простой вариант -- экспорт записей из базы. Там достаточно было добавлять нужные тэги стилей к каждому выводимому в текстовый файл полю.
 
А как себе представляется альтернатива? Вот есть некий неформатированный TXT. В итоге хочется получить тэгированный текст, который при импорте в программу верстки самооформится. Как волшебный тэгогенератор узнает, где и какой тэг ставить?

Я участвовал в решении похожей проблемы, но там был более простой вариант -- экспорт записей из базы. Там достаточно было добавлять нужные тэги стилей к каждому выводимому в текстовый файл полю.
Конечно, речь не о неформатированном, а вордовском документе. Редактора разметили все полужирности-курсивности, а в Инди половина не доходит. Особенно много возни в списках литератур, где авторы курсивом должны быть.
 
Это, скорее, вопрос к правильной работе плагина импорта вордовского файла. Безумный вариант -- а не меньше ли проблем с импортом из RTF? Уж из ворда в rtf пересохранить несложно.
 
Редактора разметили все полужирности-курсивности, а в Инди половина не доходит. Особенно много возни в списках литератур, где авторы курсивом должны быть.
пример предъявите. текста, где "не доходит"
 
видимо, символьные стили еще не освоены
 
пример предъявите. текста, где "не доходит"
Легко сказать "предъявите". Копал-копал. Итого: начертания слетают (что традиционно... для меня) в процессе присвоения стиля сносок. Стал проверять с ключом false, - отваливается VBA. Но по памяти помню, что проблемы были всегда, что с false, что с true. Поэтому если (возвращаясь к ручным тегам) "наклеить" метки на курсивы/пж/пж-курсивы (+верхние/нижние регистры) сразу в ворде и все начертания тут же, в ворде, обнулять, потом не будет головомойки с присвоениями и слетами. Надо будет попробовать по принципу расстановки неупотребляемых знаков до и после. Хотя имевшийся опыт говорит, что присвоения по тексту тоже могут быть с ошибками (часто захватывается лишний текст абзацами). Надо попотеть.
 
Последнее редактирование:
а вы до сих пор без символьных стилей жили???
 
  • Спасибо
Реакции: George
Как вариант борьбы (для себя): сохранение вордовского документа в html. Открыть его в блокноте, скопировать весь текст и через онлайн-сервис очистить от лишних тегов. Потом вычищенным заменить начинку html'a и сохранить как текст. Все это импортировать в Инди и скриптом с грепами обработать оставшиеся теги <strong>, <i> и пр. Никакой грязи от Ворда не останется. Правда надо еще посмотреть, как станут выглядеть таблички.
 
напомните, чем общепринятый метод не устраивает?
 
Писал когда-то, но напишу ещё раз.
Вот такой алгоритм даёт приемлемый результат — всё локальное форматирование сохраняется в виде символьных стилей.
Итак:
1. Открываем вордовский документ, запускаем макрос MakeStyle.
2. Лично я все списки конвертирую в текст, для этого запускаю этот макрос:
Код:
Sub ConvertListsToText()
ActiveDocument.Range.ListFormat.ConvertNumbersToText
End Sub
3. Запускаем макрос ApplyStyle, он идёт вместе с MakeStyle.
4. Если хотим форматирование в сносках то ОБЯЗАТЕЛЬНО ставим курсор в любую сноску и запускаем макрос ApplyStyle ещё раз.
5. Сохраняем в docx и втягиваем в Индизайн.
6. Если текст писался разными авторами на разных компах и в разных вордах, с разными локализациями то будет бардак, но не такой страшный. За десять-пятнадцать минут поиском проверяются все стили и удаляются лишние.

Скажу что у меня есть шаблон в котором уже настроены нужные мне стили: Normal, Heading 1, 2, 3, 4, 5, List Paragraph и прочее. А так-же там уже лежат те символьные стили которые создаёт MakeStyle. Таким образом втянутый текст требует минимальной коррекции.
 
  • Спасибо
Реакции: Linxy и LeonidB
Есть ещё этот макрос у кого-то? Ссылка мёртвая, гугл живых результатов не дал. Поиск в ресурсах тоже.
Интересно попробовать в Ворд 2013.
есть под 2016 ворд (64 бит). хотя видимо и 2013 пойдёт, но под 64 переделал давно