Автоматическая вёрстка перевода

  • Автор темы Автор темы ANDRju
  • Дата начала Дата начала
Статус
Закрыто для дальнейших ответов.

ANDRju

Участник
Топикстартер
Сообщения
15
Реакции
0
Коллеги, добрый день.


Помогите, пожалуйста, сделать первые шаги в автоматической вёрстке.

Задача заключается в том, чтобы автоматически заверстать брошюру с технической литературой на разные языки.


На данный момент есть свёрстанный на русском языке макет в индизайне. Предполагается использовать его как шаблон, основу для других языков.

Переводом на другие языки занимается подрядчик, который импортирует xml файл с оригинальным текстом в вэбтрансэлйт, где автоматически его переводит и выгружает переведённый текст так же в формате XML (прикладывая PDF).


На первый взгляд решение напрашивается само собой: оригинальную вёрстку экспортировать из индизайна в xml -> отдать на перевод -> импортировать перевод в шаблонную верстку и подправить при необходимости.

Но на практике не все так гладко. При импорте в ID переведённого xml файла слетает всё форматирование текста, стили таблиц и объектов.

Фактически приходится заново форматировать контент. Автоматическим такой подход назвать сложно - по затраченным усилиям он недалеко уходит от копи-паста.


Экспорт в xml делал так:

-расставил по тексту теги по принципу: каждый тег соответствует стилю абзаца.
-синхронизировал теги со стилями (в двух направлениях)
-экспортировал в XML со стандартными настройками: кодировка UTF-8, активный только один параметр - экспорт неразмеченных таблиц в качестве CALS XML.


Чтобы сымитировать перевод, в редакторе Altova XMLSpy вручную заменил текст и сохранил в XML. Данный XML импортируется в индизайн криво: слетают стили, добавляются лишние табуляции, пробелы и прочие, которые нужно отлавливать.


Подскажите, пжл, есть ли решение данной задачи посредством XML или я выбрал неверный путь?

Возможно, все уже придумано и существуют скпиты и плагины, которые успешно решают такие задачи.

Посоветуйте, пжл, что почитать, с чего начать, какие есть варианты решения в данном случае.
 
ну вообще говоря переводчики обычно работают спокойно с .idml
Trados его понимает
 
Подскажите, пжл, есть ли решение данной задачи посредством XML или я выбрал неверный путь?
путь верный

Данный XML импортируется в индизайн криво: слетают стили, добавляются лишние табуляции, пробелы и прочие, которые нужно отлавливать.
а как импортируется исходный XML?... и что конкретно подразумевается под "слетают стили"
 
ну вообще говоря переводчики обычно работают спокойно с .idml
Trados его понимает

К сожалению, наши переводчики работают только через web translate. Сделал запрос на возможность работы с idml файлами, пока жду ответа.
 
путь верный


а как импортируется исходный XML?... и что конкретно подразумевается под "слетают стили"

Импортирую так:
1. Открываю шаблонную верстку -> в структуре отмечаю Root -> импорт XML -> указываю измененный (переведенный) XML файл -> в параметрах импорта ставлю все галочки, кроме "Создать связь"

Слетают стили: менется флаговая выключка у всего текста, заголовки принимают стили наборного текста, появляются множественные дополнительные табуляции вначале каждого абзаца и пр. Это пока ещё без картинок...
 
Импортирую так:
это понятно)) я же привел цитату

еще раз... вы пишете, что XML, сделанный на основе "исходного", импортируется криво... я спрашиваю, как выглядит, импортированный исходный XML... загрузите его вместо кривого... тоже слетают стили, лишние пробелы и т.д.?

Слетают стили: менется флаговая выключка у всего текста, заголовки...
а стилевая разметка правильная? стили с плюсами?
 
это понятно)) я же привел цитату

еще раз... вы пишете, что XML, сделанный на основе "исходного", импортируется криво... я спрашиваю, как выглядит, импортированный исходный XML... загрузите его вместо кривого... тоже слетают стили, лишние пробелы и т.д.?


а стилевая разметка правильная? стили с плюсами?

Да, исходный XML так же импортируется криво, с теми же проблемами, что и измененный. Стилевая разметка неверная - всему тексту присваивается один стиль, как правило этот тот стиль который стоит у самого первого абзаца =(
 
Да, исходный XML так же импортируется криво, с теми же проблемами, что и измененный.
т.е. вдруг из ничего появились лишние пробелы и табуляции?

исходя из своего опыта, могу сказать, что правильное использование XML значительно облегчает работу, но всегда требует разной степени доработки верстки

если предполагается переверстка на несколько языков, целесообразно подготовить т.н. мастер-файл... смысл его подготовки заключается в том, что в сверстанном оригинал-макете удаляется все локальное форматирование, например трекинг для вгонки/выгонки, а всему остальному форматированию, необходимому для верстки, присваиваются стили... список таких стилей бывает велик... мягкие переносы тоже нужно удалить

когда такой файл готов, из него экспортируют мастер-XML, который и отдают в перевод... импорт XML производится в мастер-файл и далее по смыслу
 
  • Спасибо
Реакции: ANDRju
т.е. вдруг из ничего появились лишние пробелы и табуляции?

исходя из своего опыта, могу сказать, что правильное использование XML значительно облегчает работу, но всегда требует разной степени доработки верстки

если предполагается переверстка на несколько языков, целесообразно подготовить т.н. мастер-файл... смысл его подготовки заключается в том, что в сверстанном оригинал-макете удаляется все локальное форматирование, например трекинг для вгонки/выгонки, а всему остальному форматированию, необходимому для верстки, присваиваются стили... список таких стилей бывает велик... мягкие переносы тоже нужно удалить

когда такой файл готов, из него экспортируют мастер-XML, который и отдают в перевод... импорт XML производится в мастер-файл и далее по смыслу

Да, скорей всего всё дело в адаптации верстки под экспорт в ХМЛ. А что почитать на эту тему: как должна строиться логика верстки, что можно делать, а что не советуется и почему? Из Вашего ответа я понял, первое, что нужно сделать с версткой это максимально её упростить, стандартизировать, прописав все стили для локального форматирования или снять это локальное форматирование. Есть ли рекомендация/требование, чтобы каждый заголовок/подзаголовок (абзац с другим стилем) был в отдельном текстовом фрейме или это избыточно?
 
А что почитать на эту тему: как должна строиться логика верстки,
обычно описывается сам механизм, для чего он нужен и как им воспользоваться... вы это уже прошли, никакой особой логики верстки там не требуется

Из Вашего ответа я понял, первое, что нужно сделать с версткой это максимально её упростить, стандартизировать
все, что нужно сделать, я уже написал... главная задача -- заменить контент с минимальными потерями верстки... после заливки перевода у вас развязаны руки, делайте с версткой что хотите, но сохраните мастер-файл, если вам понадобится верстка на других языках

Есть ли рекомендация/требование, чтобы каждый заголовок/подзаголовок (абзац с другим стилем) был в отдельном текстовом фрейме или это избыточно?
таких требований не припомню... желательно в мастер-файле текстовые фреймы немного увеличивать по высоте, т.к. один и тот же текст в разных переводах имеет разную длину

"отрежьте" от своей верстки файл с парой-тройкой страниц, сделайте из него тренировочный мастер-файл с небольшим кол-вом стилей (неиспользуемые стили удалите), внесите изменения в XML, залейте и посмотрите как оно работает и что не работает
 
Статус
Закрыто для дальнейших ответов.