Обязательный электронный экземпляр и преобразование PDF в PDF/A для РГБ

  • Автор темы Автор темы BorA
  • Дата начала Дата начала
Ты предлагаешь прочесть десяток вордовских страниц, потом 65 форумных

Не по теме:
Периодически встречаю в теме фразы вроде: "Как, неужели вы не прочитали все предыдущие страницы темы?" (обычно с оттенком искреннего удивления :) )". И обычно про себя посмеиваюсь - интересно, представляет ли автор фразы сколько такое может занять времени? :)


Если в этом еще есть практический смысл (тема уже третий год идет, многое могло ус тареть), то могу собрать свои выжимки из прочитанного здесь. Но их надо сначала надо будет здесь просмотреть и где надо подправить - там в основном куски, нахватанные из сообщений.
 
Последнее редактирование:
представляет ли автор фразы сколько такое может занять времени?
А мне другое интересно, нахрна мы спрашивается, наколупали 65 страниц теоретически полезной информации если их никто читать не хочет, чисто, глядя на объем?
 
привет всем...
кто-нибудь может объяснить простыми словами, что значит эта ошибка?
шрифты не встроились, или что-то другое?

111.jpg
 
Встроились но как то криво
 
Ну обычно такое или передистилляцией или пересохранением или фиксапом сбивается. В общем - стучанием по шине ;)
 
Ну мишка. Все эти 65 страниц таки надо привести к выжимке разумной.

И если кто-то это свершит - честь ему и хвала.


Но лучшим выходом, конечно, было бы - расстрел РГБ. Особенно ейной компотдела. На месте. Без суда и следствия.
 
Все эти 65 страниц таки надо привести к выжимке разумной.
Он не хочет самого себя вспомнить. А ты говоришь прям про всё. Зато в первых рядах орёт, чтобы всю тему люди читали))
 
привет всем...
кто-нибудь может объяснить простыми словами, что значит эта ошибка?
шрифты не встроились, или что-то другое?
См. самую первую страницу этой темы, ибо я первопроходимец этой проблемы :) И совет там был от _MBK_ - скурвить эти кривые шрифты.
 
А мне другое интересно, нахрна мы спрашивается, наколупали 65 страниц теоретически полезной информации если их никто читать не хочет, чисто, глядя на объем?
Так обычная история любой объемной темы, которая годами идет. В том же форуме Ru-Board есть темы, в которых уже по несколько сотен страниц. Именно поэтому там и давняя практика - делать шапки, дублируемые в начале каждой страницы. А иначе просто утонешь. :-(
 
кто-нибудь может объяснить простыми словами, что значит эта ошибка?
шрифты не встроились, или что-то другое?
Это не столько что-то связанное с используемыми шрифтами, сколько одна из ошибок создания PDF/A-файла. Лечится (и достаточно успешно) по инструкции "Если вы получили сообщение системы проверки об ошибках".
Инструкция лежит по ссылке, которая в самом первом сообщении темы. Там архив, распакуете, вынете нужную инструкцию и отработаете ее.
 
Ну мишка. Все эти 65 страниц таки надо привести к выжимке разумной.
Могу попробовать :-), но тогда надо решить куда эту выборку будем потом складировать. И потребуется помощь в редактировании улова - надо будет кучу цитат объединить во что-то цельное и привести в более или менее читабельный вид.

Сам я максимум, что могу - отловить стоящие места и сложить их стопкой цитат.
 
Ну так Жора это и просил же
Если так, то постараюсь за ближайшую неделю управиться.
Ну, а дальше, что с наловленным делать? По опыту предыдущих копаний это будет Word-файл страниц в 10, а то и в 15. В зависимости от того, насколько тщательно прочесывать.
 
Последнее редактирование:
Если задача просто протолкнуть файлы на oek и bookchamber, докладываю: берем биндер пдф, скармливаем его файнридеру (у меня - 12), после процесса распознования (глаза закрываем на весь трэш) сохраняем как пдф-а с уставкой "текст под изображением страницы". Префлайт на PDF/A-1b проходится успешно. Проверку на обоих сайтах проходит без ошибок. Только что подписал ЭЦП журнал 84 полосы.
 
  • Спасибо
Реакции: izrukvruki
Префлайт на PDF/A-1b проходится успешно. Проверку на обоих сайтах проходит без ошибок. Только что подписал ЭЦП журнал 84 полосы.
Все бы хорошо, но кроме автоматической проверки в РГБ есть еще ручная проверка операторами. Автоматику ваш вариант скорее всего пройдет без проблем - явного "нэ то" после FineReader не должно быть.
Однако после распознавания всегда будет некоторое количество ошибок. Оператор видит их и пишет "несоответствие текстового слоя содержимому". А может не обратить внимания "подумаешь несколько мелких ошибок на страницу". В общем чистая ситуационка "то ли дождик, то ли снег". Раз получилось, два получилось, на третий - отказ.

Так что пробовать стоит, но универсальное решение из этого вряд ли получится.