Обязательный электронный экземпляр и преобразование PDF в PDF/A для РГБ

JAW

15 лет на форуме
Сообщения
15 797
Реакции
3 454
@lev, Включает.
Недавно чисто графический распознавал но чисто себе для обеспечения поиска. На валидацию, понятно, ничего не проверял.
Однако, Трансформер дешевле.

И по старому опыту лучше именно как графику, т.к. как если как текст, то как раз возникают те самые ложные пробелы и слипшиеся слова.
 

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 231
Реакции
10 852

~RA~

Одарённая.
12 лет на форуме
Сообщения
11 919
Реакции
3 469
Adobe Acrobat & Adobe Distiller.
 

zaitv

Участник
Сообщения
9
Реакции
0
Adobe Acrobat & Adobe Distiller.

При попытке сохранить в PDF/A 1a или PDF/A 1b, в Acrobat DC, дает следующую ошибку,
Теги были включены, как показывают в первых сообщениях в этой теме
 

Вложения

  • Безымянный.png
    Безымянный.png
    511.3 КБ · Просм.: 754

~RA~

Одарённая.
12 лет на форуме
Сообщения
11 919
Реакции
3 469
Сделайте, что вам пишут в окне.
 

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 231
Реакции
10 852
Слегка расшифрую - в акробате есть специальное окошко предпечатной подготовки, в нем вы (при должном старании) найдете префлайт совместимости с PDF/A показывающий потенциальные засады и фиксап, который (при определенном везении) пофиксит их.
 

zaitv

Участник
Сообщения
9
Реакции
0

Вложения

  • Безымянный3.png
    Безымянный3.png
    90.2 КБ · Просм.: 1 042
  • Безымянный2.png
    Безымянный2.png
    95.9 КБ · Просм.: 766
  • Безымянный1.png
    Безымянный1.png
    84.9 КБ · Просм.: 873
  • Безымянный.png
    Безымянный.png
    84.9 КБ · Просм.: 765

zaitv

Участник
Сообщения
9
Реакции
0
При попытке сохранить в PDF/A 1a или PDF/A 1b, в Acrobat DC, дает следующую ошибку,
Теги были включены, как показывают в первых сообщениях в этой теме


Это было до фикс, после первой фикс уже меньше ошибок, после второй фикс уже не было
 

Вложения

  • Безымянный.png
    Безымянный.png
    105.6 КБ · Просм.: 595

~RA~

Одарённая.
12 лет на форуме
Сообщения
11 919
Реакции
3 469
такой формат принимает библиотека?
Посмотрите в её требованиях! Зачем об этом на форуме спрашивать?
текстовый слой или нет: ссылка
Нормальный.

А остальные требования РГБ вы чего не соблюли? Завернут же.
 

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 231
Реакции
10 852
Проверить, примет библиотека или нет можно только единственным способом '))'
 

JAW

15 лет на форуме
Сообщения
15 797
Реакции
3 454
В смысле, как вектор, наверное?
Ну когда оно там в шрифтах, то местами буковки имеются в специфичных кодировках, вот оттуда и пытаются драть в первую очередь, но, поскольку оно не обязано быть цельным, то и получаются рваные и склеенные слова.

А распознавалки могут и как TIFF, или JPEG распознавать, какой вектор? Они такого не умеют, не заточены, сперва в растр гонят.
 

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 231
Реакции
10 852
Могут. Почитай доку по файнридеру, например.
 

Rakot

Участник
Сообщения
1
Реакции
0
Попробую объяснить.
Берем "кривой" шрифт, делаем с его помощью pdf. Открываем pdf и видим нормальный читабельный. Копируем текс например в Word и видим абракадабру. Почему, а потому что в word'е по умолчанию текст отобразится каким-нибудь arial'ом, но стоит изменить шрифт в word'е на тот, который был использован в pdf'е, как текст снова примет читабильный вид.
В чем же проблема? А в том, что в РГБ похоже хотят что бы была возможность поиска текста в pdf, а для этого все глифы должны быть на своих местах, а не непонятно где.
 

NemoSib

Участник
Сообщения
2
Реакции
0
Вот что мне говорит робот:
  • Словарь аннотаций должен включать ключ F. Флаговый бит Print (печать) ключа F следует установить на 1 и его флаговые биты Hidden (скрытый), Invisible (невидимый) и NoView (нет отображения) следует установить на 0.
Прочитал всю ветвь, но ответа найти так и не удалось. Кто как справился с этой проблемой?