Привет, народ!
Помогите, пож., решить проблему. Книга сверстана, уже в печати. У типографии претензий не возникло. Но заказчика не устраивает PDF для размещения в интернете.
Из письма:
"В PDF с электронной версией книги, к сожалению, есть проблемы.
Весь текст, который написан не русским и не латинским алфавитом (японская и китайская иероглифика), закодирован с использованием Private Use Characters (U+100000—...).
Видимо это произошло при экспорте в PDF, некоторые программы так делают.
Хотя такой текст и отображается абсолютно корректно при просмотре файла, такая перекодировка приводит к невозможности поиска в нем этих иероглифических отрывков, копированию их из файла и, соответственно, корректной индексации файла PDF поисковыми машинами и включения их в свою выдачу.
Просим Вас переделать электронный файл, чтобы всё было в порядке (в вёрстках таких проблем не было)."
Слова, о которых он пишет (китайский, японский), были набраны в Wordв кодировке Unicode. У меня всё "ищется" и взаимно копируется (Word --> Acrobat--> InDesign в любой последовательности).
Не знал, что в одном PDF-файле могут быть различные кодировки в разных словах абзаца.
Первый вопрос банальный: как я могу определить кодировку фрагмента текста в Acrobat? Допустим, выделив несколько слов инcтрументом "Selecttext" ("TouchUpTexttool"), могу посмотреть через контекстное меню свойства: Шрифт, кегль. А каким образом можно выяснить кодировку?
Второй вопрос не банальный... Как сделать PDF, чтобы весь текст был в одной кодировке Unicode, какая была изначально в Ворде?
Спасибо за помощь!
Помогите, пож., решить проблему. Книга сверстана, уже в печати. У типографии претензий не возникло. Но заказчика не устраивает PDF для размещения в интернете.
Из письма:
"В PDF с электронной версией книги, к сожалению, есть проблемы.
Весь текст, который написан не русским и не латинским алфавитом (японская и китайская иероглифика), закодирован с использованием Private Use Characters (U+100000—...).
Видимо это произошло при экспорте в PDF, некоторые программы так делают.
Хотя такой текст и отображается абсолютно корректно при просмотре файла, такая перекодировка приводит к невозможности поиска в нем этих иероглифических отрывков, копированию их из файла и, соответственно, корректной индексации файла PDF поисковыми машинами и включения их в свою выдачу.
Просим Вас переделать электронный файл, чтобы всё было в порядке (в вёрстках таких проблем не было)."
Слова, о которых он пишет (китайский, японский), были набраны в Wordв кодировке Unicode. У меня всё "ищется" и взаимно копируется (Word --> Acrobat--> InDesign в любой последовательности).
Не знал, что в одном PDF-файле могут быть различные кодировки в разных словах абзаца.
Первый вопрос банальный: как я могу определить кодировку фрагмента текста в Acrobat? Допустим, выделив несколько слов инcтрументом "Selecttext" ("TouchUpTexttool"), могу посмотреть через контекстное меню свойства: Шрифт, кегль. А каким образом можно выяснить кодировку?
Второй вопрос не банальный... Как сделать PDF, чтобы весь текст был в одной кодировке Unicode, какая была изначально в Ворде?
Спасибо за помощь!