Подскажите как это сделать?Можете выложить хотя бы одну страничку исходного pdf? Возможно, кто-нибудь подскажет на конкретном примере, что делать.
Подскажите как это сделать?Можете выложить хотя бы одну страничку исходного pdf? Возможно, кто-нибудь подскажет на конкретном примере, что делать.
Проблемный PDF (ссылка удалена)
Может, кто-то и сможет победить, у меня не получилось с кодировкой. Проблема в Ваших шрифтах CompositeTT, я такие у себя сразу курвлю питстоповским экшеном - но у меня таких символов штук десять на весь макет (значки всякие), а у Вас - весь основной текст ими набран, поэтому всё скурвить не удастся, пропадёт необходимый для РГБ текстовый слойКороче, как я понял, коллективный разум не поможет... ((
Идея. Сам не пробовал. Курвим всё, сохраняем под новым именем. Далее OCR акробата с подкладыванием распознанного текста под курвы (не полная замена) - язык русский, profit.Может, кто-то и сможет победить, у меня не получилось с кодировкой. Проблема в Ваших шрифтах CompositeTT, я такие у себя сразу курвлю питстоповским экшеном - но у меня таких символов штук десять на весь макет (значки всякие), а у Вас - весь основной текст ими набран, поэтому всё скурвить не удастся, пропадёт необходимый для РГБ текстовый слой
Возможно, надо сначала поменять кодировку программой recode-ttf, но я не пробовал.
На самом деле это вёрстка в IndesignCC, шрифты TimesNewRoman и PT Sans. Никаких CompositeTT и в помине нет. С типографией никаких проблем, копирование текста без проблем. А вот ущербный PDF/A всё уничтожает. Это просто жесть.Может, кто-то и сможет победить, у меня не получилось с кодировкой. Проблема в Ваших шрифтах CompositeTT, я такие у себя сразу курвлю питстоповским экшеном - но у меня таких символов штук десять на весь макет (значки всякие), а у Вас - весь основной текст ими набран, поэтому всё скурвить не удастся, пропадёт необходимый для РГБ текстовый слой
Возможно, надо сначала поменять кодировку программой recode-ttf, но я не пробовал.
А затем делаем PDF/A и весь текст опять в хлам.Идея. Сам не пробовал. Курвим всё, сохраняем под новым именем. Далее OCR акробата с подкладыванием распознанного текста под курвы (не полная замена) - язык русский, profit.
Баба Ванга нашептала? С чего бы? OCR подложка в Акробате специально для PDF/A и придумывалась адобами.А затем делаем PDF/A и весь текст опять в хлам.
Засунул PDF в файнридер12, распознал и сохранил в PDF/A.Баба Ванга нашептала? С чего бы?
Так вы пробовали сами то, о чём говорили? Префлай проверку проходит? No problems found?Вы очень тяжёлый человек. Где-нибудь в моём посте было слово "файнридер"?
И что? Вёрстка производится PT Sans и Таймсом. В чём косяк? Неправильные опции экспорта в PDF из индизайна?
В чём косяк, не знаю, но когда-то, на примерах отфутболенных из РГБ файлов, было выявлено, что такие шрифты вот такие проблемы и создаютВ чём косяк?
Могу только предположить, что самый обычный TimesNewRoman косячит, потому что онВ чём косяк, не знаю, но когда-то, на примерах отфутболенных из РГБ файлов, было выявлено, что такие шрифты вот такие проблемы и создают
Для тех у кого рация на бронепоезде: у Акробата свой механизм OCR, создающий подложечный текст, не трогая отображение курв. Мне не надо пробовать, просто подал идею. Но Вы её исказили под сторонний софт.Так вы пробовали сами то, о чём говорили? Префлай проверку проходит? No problems found?
Таки профит или "ну я только в теории могу, а на практике возиться не охота" ?
Попробуйте с этим файлом (ссылка удалена) произвести дальнейшие действия (у меня сейчас под рукой нет XI Акробата, а 8-й для корректного эксперимента не подходит).
Что я должен с этим файлом сделать?@Loginov, после передистиллирования Вашего файла встроенные в pdf шрифты меняются:
Посмотреть вложение 103590
Попробуйте с этим файлом произвести дальнейшие действия (у меня сейчас под рукой нет XI Акробата, а 8-й для корректного эксперимента не подходит).