Обязательный электронный экземпляр и преобразование PDF в PDF/A для РГБ

  • Автор темы Автор темы BorA
  • Дата начала Дата начала
Забыл уточнить, какой фиксап использовать?
Как то упустил я один способ :) Если проблема с ресурсами, то может помочь запустить тот же фиксап что у Вас, но через батч. В батче указать например обрабатывать файлы из такой папки сохранять в такую-то. Сам файл при этом открывать не нужно будет, только положить в исходную папку. При таком варианте, он на порядок меньше ресурсов задействует.
 
Как то упустил я один способ :) Если проблема с ресурсами, то может помочь запустить тот же фиксап что у Вас, но через батч. В батче указать например обрабатывать файлы из такой папки сохранять в такую-то. Сам файл при этом открывать не нужно будет, только положить в исходную папку. При таком варианте, он на порядок меньше ресурсов задействует.
Так тут не в моих ресурсах проблема. По правилу PDF A-1b dictionary CosDoc не должен превышать размер 4095. Там используется булевая операция и надо только понять, на какое условие она реагирует так. Что именно в словарях надо править.
 
Здравствуйте!
При загрузке файла в РГБ заявку отклоняют с такой ошибкой...
Мы верстаем в Индизайн, шрифт - Прагматика.
Так вот, бывает, что текст копируется без кракозябр, а бывает весь в кракозябрах.
Что это может быть? Очень нужный дельный совет! Всем спасибо!
 

Вложения

  • Отклонена- скриншот.jpg
    Отклонена- скриншот.jpg
    70.7 КБ · Просм.: 342
Внимательно перечитать данный топик(особенно его фак) и текст ошибки от начала до конца.

Благодарю! Мы уже всё перечитали, всё попробовали, но ничего не выходит( А знающего человека у нас нет :(
 
Что именно пробовали? Вы подмножество внедряете или все?
 
Здравствуйте!
При загрузке файла в РГБ заявку отклоняют с такой ошибкой...
Мы верстаем в Индизайн, шрифт - Прагматика.
Так вот, бывает, что текст копируется без кракозябр, а бывает весь в кракозябрах.
А вы знаете разницу между subset, subset embedd и embedded fonts? Соблюдаете?
Здравствуйте!
При загрузке файла в РГБ заявку отклоняют с такой ошибкой...
У Вас два варианта:
Первый:
Внимательно перечитать данный топик(особенно его фак) и текст ошибки от начала до конца.
Второй:
Скачать валидатор veraPDF, прогнать через него свой pdf-файл и посмотреть на английском, что означают ошибки.

PS: Но должен предупредить, без Первого всё-равно вряд ли сможете разобраться.
 
Добавлю:
3. Заплатить специалисту, что найдёт причину и обучить делать правильно.
4. Мучить фрумчан несодержательными сообщениями до победного. ;)
 
  • Спасибо
Реакции: german и _MBK_
Судя по предыдущим постам, единственный действенный вариант - 3 *(
 
  • Спасибо
Реакции: german
Добрый день всем. Решил тоже поделиться своими успехами.

Спасибо за Инструкции по ошибкам PDF обязательного экземпляра
благодаря им pdf/A-файл успешно создан через пересохрание в формат постскрипт и последующей обработкой в Distiller.

В итоге РГБ выдавал только ошибку «Неверная кодировка текста».
Газету верстаем в PageMakere 7 (ОС Windows 7). Используем Adobe Acrobat X, так что решение с конвертацией TTF-шрифта в CID не подходило, т.к. в десятой версии такого фиксапа нет. Покупать более новую версию нет денег.

Выручила утилита pdf-recode (конкретно pdf-recode210111.exe).
После неё текст из pdf стал копироваться не крякозябрами. РГБ стало выдавать ошибки на несоответствие ISO либо что-то про «Ключевое слово stream (поток)».

Помогла повторная конвертация в PDF/A в Acrobat Reader (Инструменты→Допечатная подготовка→Предпечатная проверка→Convert to PDF/A-1b (sRGB)). После этого РГБ стала принимать файлы.

Неудобство было в том что мы ежедневная газета (отправлять начальство заставило с 2017 года. это около 600 файлов), а для работы утилиты recode нужно вручную каждый раз через пробел забивать имя файла при перекодировании
pdf-recode210111.exe "TI#101 (7160) 25.06.2019.pdf"
Долго и неудобно.
Написал bat-файл для обработки готовых pdf-файлов, которые лежат в определенной папке.
Может кому-нибудь пригодится.

Вот его содержание:

for %%i in (*.pdf) do cmd /C F:/gazeta/Arhive/pdf-recode210111.exe "F:/gazeta/Arhive/PS/%%i"

Пояснения: Утилита pdf-recode210111 находится в папке F:/gazeta/Arhive/,
pdf-файлы подлежашие обработке в F:/gazeta/Arhive/PS/.

Замените на свои пути и готово.
Например, если утилита pdf-recode лежит в C:/recode, а pdf-файлы в C:/PDF

for %%i in (*.pdf) do cmd /C C:/recode/pdf-recode210111.exe "C:/PDF/%%i"
Подскажите, почему у меня эта утилита не работает?
Перетаскиваю pdf на иконку и выскакивает ошибка:
1612507891047.png

Нужно чтоб в системе что-то было установлено?

В соседней теме давали ссылочку вот на такую разработку, тоже не разобрался как ее использовать... pdf_recode.pl как запустить?
 
Подскажите, почему у меня эта утилита не работает?
Даже и не знаю, я ж не автор, только допилил слегка причем настолько давно, что напрочь не помню ее логику
Судя по коду, эту ошибку все что угодно вызывать может 'hz'
 
дык не запускается у меня ничего...
 
Я так понимаю, что нужен perl установленный
 
что нужен perl установленный
Не нужен
Я ж писал, там standalone приложение, скворец уже внутри
Cant save - неведомая ошибка, генерируемая при попытке записи в файл PDF в самом конце кода
Вангую что-то не то с именем файла или правами доступа к сохраняемому каталогу
 
Там скрипт с расширение .pl
Там нужен
Но код один и тот же
Это я про другую разработку. ссылку я оставил выше. Там скрипт с расширение .pl

Посмотреть вложение 140652
'hz' попробуйте с командной строки или на другом диске
 
Ошибку генерит вот эта строка
Perl:
eval { $doc->output( substr( $filename, 0, -4 )."+.pdf" ) };
я перл не умею, по моему разумению, она формирует новое имя файла из старого отрезая последние 4 символа и приклеивая взамен их "+.pdf"
От чего именно это может не работать в душе не чаю 'hz'