Обязательный электронный экземпляр и преобразование PDF в PDF/A для РГБ

  • Автор темы Автор темы BorA
  • Дата начала Дата начала
@lev, Включает.
Недавно чисто графический распознавал но чисто себе для обеспечения поиска. На валидацию, понятно, ничего не проверял.
Однако, Трансформер дешевле.

И по старому опыту лучше именно как графику, т.к. как если как текст, то как раз возникают те самые ложные пробелы и слипшиеся слова.
 
Adobe Acrobat & Adobe Distiller.
 
Adobe Acrobat & Adobe Distiller.

При попытке сохранить в PDF/A 1a или PDF/A 1b, в Acrobat DC, дает следующую ошибку,
Теги были включены, как показывают в первых сообщениях в этой теме
 

Вложения

  • Безымянный.png
    Безымянный.png
    511.3 КБ · Просм.: 798
Сделайте, что вам пишут в окне.
 
Слегка расшифрую - в акробате есть специальное окошко предпечатной подготовки, в нем вы (при должном старании) найдете префлайт совместимости с PDF/A показывающий потенциальные засады и фиксап, который (при определенном везении) пофиксит их.
 

Вложения

  • Безымянный3.png
    Безымянный3.png
    90.2 КБ · Просм.: 1 083
  • Безымянный2.png
    Безымянный2.png
    95.9 КБ · Просм.: 804
  • Безымянный1.png
    Безымянный1.png
    84.9 КБ · Просм.: 914
  • Безымянный.png
    Безымянный.png
    84.9 КБ · Просм.: 802
При попытке сохранить в PDF/A 1a или PDF/A 1b, в Acrobat DC, дает следующую ошибку,
Теги были включены, как показывают в первых сообщениях в этой теме


Это было до фикс, после первой фикс уже меньше ошибок, после второй фикс уже не было
 

Вложения

  • Безымянный.png
    Безымянный.png
    105.6 КБ · Просм.: 633
такой формат принимает библиотека?
Посмотрите в её требованиях! Зачем об этом на форуме спрашивать?
текстовый слой или нет: ссылка
Нормальный.

А остальные требования РГБ вы чего не соблюли? Завернут же.
 
Проверить, примет библиотека или нет можно только единственным способом '))'
 
В смысле, как вектор, наверное?
Ну когда оно там в шрифтах, то местами буковки имеются в специфичных кодировках, вот оттуда и пытаются драть в первую очередь, но, поскольку оно не обязано быть цельным, то и получаются рваные и склеенные слова.

А распознавалки могут и как TIFF, или JPEG распознавать, какой вектор? Они такого не умеют, не заточены, сперва в растр гонят.
 
Могут. Почитай доку по файнридеру, например.
 
Попробую объяснить.
Берем "кривой" шрифт, делаем с его помощью pdf. Открываем pdf и видим нормальный читабельный. Копируем текс например в Word и видим абракадабру. Почему, а потому что в word'е по умолчанию текст отобразится каким-нибудь arial'ом, но стоит изменить шрифт в word'е на тот, который был использован в pdf'е, как текст снова примет читабильный вид.
В чем же проблема? А в том, что в РГБ похоже хотят что бы была возможность поиска текста в pdf, а для этого все глифы должны быть на своих местах, а не непонятно где.
 
Вот что мне говорит робот:
  • Словарь аннотаций должен включать ключ F. Флаговый бит Print (печать) ключа F следует установить на 1 и его флаговые биты Hidden (скрытый), Invisible (невидимый) и NoView (нет отображения) следует установить на 0.
Прочитал всю ветвь, но ответа найти так и не удалось. Кто как справился с этой проблемой?