Обязательный электронный экземпляр и преобразование PDF в PDF/A для РГБ

JAW

15 лет на форуме
Сообщения
15 797
Реакции
3 454
@lev, Включает.
Недавно чисто графический распознавал но чисто себе для обеспечения поиска. На валидацию, понятно, ничего не проверял.
Однако, Трансформер дешевле.

И по старому опыту лучше именно как графику, т.к. как если как текст, то как раз возникают те самые ложные пробелы и слипшиеся слова.
 

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 188
Реакции
10 844

~RA~

Одарённая.
12 лет на форуме
Сообщения
11 860
Реакции
3 450
Adobe Acrobat & Adobe Distiller.
 

zaitv

Участник
Сообщения
9
Реакции
0
Adobe Acrobat & Adobe Distiller.

При попытке сохранить в PDF/A 1a или PDF/A 1b, в Acrobat DC, дает следующую ошибку,
Теги были включены, как показывают в первых сообщениях в этой теме
 

Вложения

  • Безымянный.png
    Безымянный.png
    511.3 КБ · Просм.: 753

~RA~

Одарённая.
12 лет на форуме
Сообщения
11 860
Реакции
3 450
Сделайте, что вам пишут в окне.
 

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 188
Реакции
10 844
Слегка расшифрую - в акробате есть специальное окошко предпечатной подготовки, в нем вы (при должном старании) найдете префлайт совместимости с PDF/A показывающий потенциальные засады и фиксап, который (при определенном везении) пофиксит их.
 

zaitv

Участник
Сообщения
9
Реакции
0

Вложения

  • Безымянный3.png
    Безымянный3.png
    90.2 КБ · Просм.: 1 040
  • Безымянный2.png
    Безымянный2.png
    95.9 КБ · Просм.: 765
  • Безымянный1.png
    Безымянный1.png
    84.9 КБ · Просм.: 872
  • Безымянный.png
    Безымянный.png
    84.9 КБ · Просм.: 764

zaitv

Участник
Сообщения
9
Реакции
0
При попытке сохранить в PDF/A 1a или PDF/A 1b, в Acrobat DC, дает следующую ошибку,
Теги были включены, как показывают в первых сообщениях в этой теме


Это было до фикс, после первой фикс уже меньше ошибок, после второй фикс уже не было
 

Вложения

  • Безымянный.png
    Безымянный.png
    105.6 КБ · Просм.: 593

~RA~

Одарённая.
12 лет на форуме
Сообщения
11 860
Реакции
3 450
такой формат принимает библиотека?
Посмотрите в её требованиях! Зачем об этом на форуме спрашивать?
текстовый слой или нет: ссылка
Нормальный.

А остальные требования РГБ вы чего не соблюли? Завернут же.
 

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 188
Реакции
10 844
Проверить, примет библиотека или нет можно только единственным способом '))'
 

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 188
Реакции
10 844

JAW

15 лет на форуме
Сообщения
15 797
Реакции
3 454
В смысле, как вектор, наверное?
Ну когда оно там в шрифтах, то местами буковки имеются в специфичных кодировках, вот оттуда и пытаются драть в первую очередь, но, поскольку оно не обязано быть цельным, то и получаются рваные и склеенные слова.

А распознавалки могут и как TIFF, или JPEG распознавать, какой вектор? Они такого не умеют, не заточены, сперва в растр гонят.
 

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 188
Реакции
10 844
Могут. Почитай доку по файнридеру, например.
 

Rakot

Участник
Сообщения
1
Реакции
0
Попробую объяснить.
Берем "кривой" шрифт, делаем с его помощью pdf. Открываем pdf и видим нормальный читабельный. Копируем текс например в Word и видим абракадабру. Почему, а потому что в word'е по умолчанию текст отобразится каким-нибудь arial'ом, но стоит изменить шрифт в word'е на тот, который был использован в pdf'е, как текст снова примет читабильный вид.
В чем же проблема? А в том, что в РГБ похоже хотят что бы была возможность поиска текста в pdf, а для этого все глифы должны быть на своих местах, а не непонятно где.
 

NemoSib

Участник
Сообщения
2
Реакции
0
Вот что мне говорит робот:
  • Словарь аннотаций должен включать ключ F. Флаговый бит Print (печать) ключа F следует установить на 1 и его флаговые биты Hidden (скрытый), Invisible (невидимый) и NoView (нет отображения) следует установить на 0.
Прочитал всю ветвь, но ответа найти так и не удалось. Кто как справился с этой проблемой?