Обязательный электронный экземпляр и преобразование PDF в PDF/A для РГБ

  • Автор темы Автор темы BorA
  • Дата начала Дата начала
Насчет недели на прочесывание темы я похоже оказался слишком большим оптимистом - все еще не закончил. :)
По ходу дела возник вопрос - в каком виде собирать в Word-файл отрывки из темы?

Можно просто цитатами, например:
"По последнему пункту понятно - более поздний стандарт требует наличие XMP метаданных в PDF файле, а по стандартам PГБ это вроде как необязательно".

А можно цитатами и с пометками кто и где об этом говорил, например:
По последнему пункту понятно - более поздний стандарт требует наличие XMP метаданных в PDF файле, а по стандартам PГБ это вроде как необязательно

Какой вариант предпочтительнее? С учетом того, что таких цитат в этом Word-файле будет фигова туча. :)
 
Последнее редактирование модератором:
Можно просто цитатами, например:
"По последнему пункту понятно - более поздний стандарт требует наличие XMP метаданных в PDF файле, а по стандартам PГБ это вроде как необязательно".
Движок же автоматом это делает. Пусть будет прям с тегами.
 
George, я намеренно сделал вторую цитату именно в том виде, как она потом будет выглядеть в Word-файле. Чтобы можно было сравнить оба варианта. Word ведь здешние тэги не понимает, для они просто набор символов.
Так что хорошо бы вернуть мое сообщение в первоначальный вид, а то теряется смысл вопроса.
 
Движок же автоматом это делает.
Так ведь именно здешний движок. А в Word будут просто тэги, как они есть здесь в редакторе (я именно из него копировал).
Но если в виде "цитата с тэгами" все нормально, то так буду и дальше
 
Последнее редактирование:
Мне все равно. Но зато Родина будет помнить кто что предложил))
 
Добрый день всем. Решил тоже поделиться своими успехами.

Спасибо за Инструкции по ошибкам PDF обязательного экземпляра
благодаря им pdf/A-файл успешно создан через пересохрание в формат постскрипт и последующей обработкой в Distiller.

В итоге РГБ выдавал только ошибку «Неверная кодировка текста».
Газету верстаем в PageMakere 7 (ОС Windows 7). Используем Adobe Acrobat X, так что решение с конвертацией TTF-шрифта в CID не подходило, т.к. в десятой версии такого фиксапа нет. Покупать более новую версию нет денег.

Выручила утилита pdf-recode (конкретно pdf-recode210111.exe).
После неё текст из pdf стал копироваться не крякозябрами. РГБ стало выдавать ошибки на несоответствие ISO либо что-то про «Ключевое слово stream (поток)».

Помогла повторная конвертация в PDF/A в Acrobat Reader (Инструменты→Допечатная подготовка→Предпечатная проверка→Convert to PDF/A-1b (sRGB)). После этого РГБ стала принимать файлы.

Неудобство было в том что мы ежедневная газета (отправлять начальство заставило с 2017 года. это около 600 файлов), а для работы утилиты recode нужно вручную каждый раз через пробел забивать имя файла при перекодировании
pdf-recode210111.exe "TI#101 (7160) 25.06.2019.pdf"
Долго и неудобно.
Написал bat-файл для обработки готовых pdf-файлов, которые лежат в определенной папке.
Может кому-нибудь пригодится.

Вот его содержание:

for %%i in (*.pdf) do cmd /C F:/gazeta/Arhive/pdf-recode210111.exe "F:/gazeta/Arhive/PS/%%i"

Пояснения: Утилита pdf-recode210111 находится в папке F:/gazeta/Arhive/,
pdf-файлы подлежашие обработке в F:/gazeta/Arhive/PS/.

Замените на свои пути и готово.
Например, если утилита pdf-recode лежит в C:/recode, а pdf-файлы в C:/PDF

for %%i in (*.pdf) do cmd /C C:/recode/pdf-recode210111.exe "C:/PDF/%%i"
 
Неудобство было в том что мы ежедневная газета (отправлять начальство заставило с 2017 года. это около 600 файлов), а для работы утилиты recode нужно вручную каждый раз через пробел забивать имя файла при перекодировании
pdf-recode210111.exe "TI#101 (7160) 25.06.2019.pdf"
Долго и неудобно.
гораздо проще просто перетащить мышкой файл ПДФ на pdf-recode210111.exe :)
 
Такого нет, но я с такими работал. Всегда приходилось две копии делать на всякий случай.
Лучше подскажите, можно ли как-нибудь в Acrobat Reader X сделать пакетную обработку файлов для пересохранения pdf в ps?
 
Сообщаю результаты. В РГБ успешно сдали 69 файлов за 3 месяца.
Проблема возникла лишь с одним файлом, где на полосе стоял сторонний рекламный модуль в формате EPS. Пришлось поставить его в формате TIF. И всё прошло.
 
Ну, началось...

Информационное сообщение о возможном сбое при обработке обязательного экземпляра печатного издания в электронной форме

13.05.2019 в рамках регламентной технической поддержки была произведена замена жёсткого диска в системе приема и хранения обязательных экземпляров печатных изданий в электронной форме. При начале копирования данных на заменённый диск произошёл сбой второго диска той же дисковой группы, настроенной с учётом возможности сбоя лишь одного жёсткого диска. На дисковой группе располагалась общая сетевая папка, предназначенная для временного хранения файлов, поступающих в рамках получения обязательного экземпляра печатных изданий в электронной форме (ОЭК). В результате сбоя была повреждена часть файлов, загруженных издателями, процесс обработки которых не был завершён.
В связи с этим просим вас повторно загрузить файлы, воспользовавшись ссылкой: <....>
Приносим извинения за доставленные неудобства и благодарим за сотрудничество.
-------------------------
Система приема обязательного экземпляра печатных изданий в электронной форме
Российская государственная библиотека
+7 (499) 557-04-71
 
Разыгралась фантазия на тему "просим вас повторно загрузить файлы ".
А если ответить дорогим (по объемам нервозатрат) РГБшникам - "Извините, во время архивирования отправленных Вам ранее PDF-ов (и исходников верстки тоже) случилась неприятность и половина файлов попортилась, а оставшаяся половина винчестера вовсе сгорела. И теперь я не знаю, как ВЫ БУДЕТЕ ИЗ ЭТОЙ СИТУАЦИИ ВЫКРУЧИВАТЬСЯ. С наилучшими пожеланиями и т.д."
А если такие письма отправят все потерпевшие - это будет полный ахтунг! Не думаю, что РГБ сможет получить санкцию прокурора на обыск в издательствах на предмет скрываемых файлов.
А попутно (чисто гуманизм) можно посоветовать РГБ сходить за дублями утраченных PDF на поклон (на коленях, с мешком денег) к их адекватным коллегам из Книжной Палаты.
 
Ну, в общем я погуглил многое и понял...
Просто факт: после так называемого письма счастья.
Один и тот же номер одной из наших газет принят в архив... и в другом про этот же номер требует его по новой залить.
Мне смешно и немного грустно.
А георгу хочется сказать что конечно "пора отвыкать уже" - наверное это нужно, но толку от этого не будет. И конечно индизайн круче. Нужно его покупать. и изучать.
И просьба - хотя конечно она плоха. Сколько Георгу лет. Мне 46. (Она произошла после сентенций с восклицательным знаком, извините за непрофессионализм)
 
Последнее редактирование:
Не думаю, что РГБ сможет получить санкцию прокурора на обыск в издательствах на предмет скрываемых файлов.
Кроме пустого бухтения на форуме ничего не будет. Потому что на стороне РГБ федеральный закон, и редакции по факту должны, а не наоборот. Можете возмущаться сколько угодно, а в конце года получите уведомление/предупреждение, а затем и всё остальное, что полагается по закону за невыполнение. Это именно так и работает, а не иначе :sarcasm:

А попутно (чисто гуманизм) можно посоветовать РГБ сходить за дублями утраченных PDF на поклон (на коленях, с мешком денег) к их адекватным коллегам из Книжной Палаты.
В Книжной Палате не требуют PDF-A.
 
Ага, тоже пришло "письмо счастия". Рукожопы: "Один ваш экземпляр мы сломали, а остальные - потеряли".'fp'
Боюсь что рукожопы те, кто не хранит PDF-A (да и любые другие архивы). А то ведь и вправду, в 2019 году народ еще пятидюймовками пользуется (хорошо что не кассетами с перфокартами) :bayan:
 
to ManPaper
В Книжной Палате не требуют PDF-A.
Насколько вменяемо трактуют в РГБ формат PDF-A, полагаю, расшифровывать не надо - примерно 1000 из 1400 предыдущих постов в этой теме именно этому посвящены. Такую принципиальность в отбраковке материалов многие не одобряют (и вовсе не потому, что не могут справиться с туповатыми бюрократами из РГБ - уже поднаучились, и других поднаучили).
Я, может, не полностью врубился - вы отправляет РАЗНЫЕ версии PDF в РГБ и КнижПалату? Типа, для КП - не PDF-A, а в РГБ - PDF-A? Мне казалось, что иметь одну версию "на всё про всё" (в нашем случае РГБ-кошерную PDF-A) более логично.
А степень смирения с неизбежным индивидуальна - у кого-то потерялось 2 файла, а мне штук 70 заново закидывать. Даже при выполнении этих операций в фоновом режиме (с учетом текущей реакции системы приема файлов) - неделя набежит. Ура...