Обязательный электронный экземпляр и преобразование PDF в PDF/A для РГБ

  • Автор темы Автор темы BorA
  • Дата начала Дата начала
И что с этим делать?
Поменять кодировку во встроенном в PDF шрифте - достаточно нетривиальная задача, насколько я понимаю, даже питстоп такое не умеет. Можно поменять свойство /Encoding - но тогда проблемы начинают сыпаться как из рога изобилия ибо акробат чует подвох и,вероятно, проверка тоже его почувствует. Можно ремапнуть все символы - но это тоже ничего не даст, ибо кодировка останется прежней. В общем, проблема пока существует и универсального решения не найдено, хотя мы работаем над этим. Некоторые выкручиваются совершенно лобовым способом - скривливают шрифты и распознают файнридером - результат такого распознавания (вроде бы) имеет вменяемую кодировку. Но, это не панацея.
 
Я уже писал о причине данной проблеме. Продолжу.
Проблема возникает, когда производитель PDF начинает сжимать шрифты. OpenType, например, часто ужимают в Adobe Compact Font Format, выбрасывая по-ходу все неиспользуемые символы и сжимая адресацию символов до ANSI, перемещая кириллические символы на несвойственные им позиции.
Написать чинилку теоретически можно, но в практической надобности сего я сильно сомневаюсь.

Например, для некоторых производителей PDF будет достаточным указать "не сокращать знаковый состав встраиваемых шрифтов" и проблемы возникать не будет.
 
  • Спасибо
Реакции: LeonidB
Ты описываешь,так сказать, источник проблемы.
А в 99% случаев ее надо решать уже на готовых PDF файлах
 
А в 99% случаев ее надо решать уже на готовых PDF файлах
Насколько мне известно, на данный момент, готового решения не существует.
Да и
Написать чинилку теоретически можно, но в практической надобности сего я сильно сомневаюсь.
 
А мне, наоборот, странно, что при наличии весьма долбящей проблемы, решения никто не сделал.
К примеру, всевозможных ремэпперов юникодных символов 100500 а конвертеров кодировки - нет вообще 'hmmm'
 
Потому что потребность в решении этой проблемы не платёжеспособна.
 
Последнее редактирование:
  • Спасибо
Реакции: lopuh
@LeonidB, Я раньше пробовала прогонять файл с этими настройками дистиллера, pdf/a после конвертации создавался, а дальше РГБ не пропускала все с той же ошибкой текстового слоя.
P.S. Пока что решили пригласить специалиста-печатника, чтобы на месте разобрался. Если получится победить робота РГБ, потом отпишусь.
 
а дальше РГБ не пропускала все с той же ошибкой текстового слоя.
Это уже совсем другая ошибка, с кодировкой не связанная, я, кстати, так и не понимаю ее сущность. По идее, документ со слоями вообще не должен верификацию проходить по определению, так чего они тогда хотят? 'hmmm'Просто наличия текста в документе? Так он есть
 
Попробуйте передистиллить Ваш pdf (или, лучше, заново перевывести макет) с вот этими настройками дистиллера.

А затем заново прогнать профиль префлайта Convert to PDF/A-1b.
Дополнение к вышеописанному способу.
Он работает только для шрифтов Type-1, для TrueType передистилляция как слону дробина - после открытия полученного постскрипта, кодировка шрифта все равно Ansi
Однако, можно создать фиксап конвертирования TrueType шрифтов в CID:
upload_2017-6-26_15-51-36.png

Уже после обработки этим фиксапом анноящая Ansi кодировка сбивается напрочь.
Но как к данным манипуляциям отнесется РГБ - нужно проверять 'hmmm'
 
Однако, можно создать фиксап конвертирования TrueType шрифтов в CID
@_MBK_, подскажите, пожалуйста, где именно находится в fixup подпункт Convert TrueType fonts to CID. Не смогла его отыскать.
Пока что удалось отправить один файл в РГБ. Для этого пришлось заменить в макете основной шрифт (он был формата OpenType) на похожий формата Type 1.
 
где именно находится в fixup подпункт Convert TrueType fonts to CID.
Ну там же на скриншоте прямо нарисовано как. Возможно, от версии акробата зависит, но в XI пошагово:
1) Открываете окно префлайтов Tools-Print production-Preflight
2) Ищете вкладку PDF fixups, тыкаете в любой и жмете кнопочку Edit
3) В открывшемся окне создаете новый фиксап нажимая на левый нижний "+", выбиратете тип полученного профайла, выбрав из его списка "Fixups", слева раскрывается список доступных фиксапов
4) Данный фиксап, внезапно, тоже нестандартный, поэтому создаем его тоже, нажимая плюсик снизу под правым списком "New fixup"
5) Открывается окно Create fixup и в нем уже из верхнего списка (как у меня на скриншоте) выбираем пункт Document-Convert TrueType fonts to CID
6) Назначаем созданный новый фиксап новому профилю и теперь можем спокойно конвертировать им
 
  • Спасибо
Реакции: Лана С
@_MBK_, подскажите, пожалуйста, где именно находится в fixup подпункт Convert TrueType fonts to CID. Не смогла его отыскать.
Пока что удалось отправить один файл в РГБ. Для этого пришлось заменить в макете основной шрифт (он был формата OpenType) на похожий формата Type 1.
Пожалуй встряну. Надеюсь меня простят.
Запускайте предпечатную проверку (префлайт). В нем находите кнопочку "селект сингл фиксапс". Находите строчку фиксапа "embed font". зАХОДИТЕ В ЕГО РЕДАКТИРОВАНИЕ. Находите там строчку "конверт труе тупе ту cid".
Я так нашел... Может и чото не верно делал так как эффекта у меня не было. Но вроде что-то делалолсь.
 
  • Спасибо
Реакции: _MBK_
, подскажите, пожалуйста, где именно находится в fixup подпункт Convert TrueType fonts to CID. Не смогла его отыскать.
Пока что удалось отправить один файл в РГБ. Для этого пришлось заменить в макете основной шрифт (он был формата OpenType) на похожий формата Type 1.

Можно еще попробовать для перекодирования pdf-recode
Качаете архив. Я выбрал в архиве самую последнюю версию.
Ложите распакованный в отдельную папку. В эту же папку кидаете проблемный пдф.
Открываете проводник. "Берете" пдф левой кнопкой мыши и кидаете на программу конвертор. Он быстро конвертирует.
Потом надо еще сконвертировать этот пдф в пдфа.
Помогло, но эксперементирую дальше.
Это все с подачи уважаемого МВК
@_MBK_
 
Ну там же на скриншоте прямо нарисовано как. Возможно, от версии акробата зависит, но в XI пошагово:
5) Открывается окно Create fixup и в нем уже из верхнего списка (как у меня на скриншоте) выбираем пункт Document-Convert TrueType fonts to CID
Спасибо за пошаговое объяснение, но в 10-м акробате, судя по всему, этот пункт (Convert TrueType fonts to CID) отсутствует...
 

Вложения

  • NEW_fixup.png
    NEW_fixup.png
    43.2 КБ · Просм.: 1 028
Можно еще попробовать для перекодирования pdf-recode
Попробовала. Не поняла, что он там перекодировал, но страничка макета со шрифтами TrueType, которая вчера не смогла загрузиться в РГБ, сегодня прошла автоматическую проверку. Позже буду пробовать весь файл загрузить.
 
но в 10-м акробате, судя по всему, этот пункт (Convert TrueType fonts to CID) отсутствует...
Точно не помню, но ИМХО он и в восьмой был 'hmmm'
Попробуйте все префлайты пересмотреть, возможно,он не в разделе Document
 
Попробовала. Не поняла, что он там перекодировал, но страничка макета со шрифтами TrueType,
Эта штука TrueType не перекодирует, перед использованием надо их в Type 1 перегонять.
Насчет того, получится ли этот фокус с CID я не уверено, но для корректной работы CMap должен присутствовать однозначно, фиксап по созданию CMap тоже имеет место быть