Обязательный электронный экземпляр и преобразование PDF в PDF/A для РГБ

  • Автор темы Автор темы BorA
  • Дата начала Дата начала
...сабсеты с убитой кодировкой и скурвленные тексты.
Первое должно решаться переходом на 2u/3u, снова призываю всех заинтересованных к тестированию!

Курвы на обложках, в рекламе и т.п. - административный подход ;)
 
Если в шрифт символы стоят в нестандартных местах, то волшебный /u чудесным образом сам их не расставит.
Читаем, например, тут: https://arxiv.org/pdf/1406.6126.pdf
PDF/A is being adopted by publishers and Government agencies for the long-
term preservation of important documents in electronic form. There are a few
variants, which pay more or less regard to Accessibility considerations; i.e., ‘a’ for
accessible, ‘b’ for basic, ‘u’ for (presence of) unicode mappings for all font charac-
ters. Later versions [3,4] of this ISO standard [2] allow for other file attachments
in various data formats. In particular, the PDF/A-3u variant allows the inclu-
sion of embedded files of arbitrary types, to convey supplementary descriptions
of technical portions of a document’s contents.
В моём понимании, unicode mappings - это сохранение юникод-кода символа вне зависимости от того, какой код он получил в сабсете. Prove me wrong.
 
У нас было Федеральный закон от 29.12.1994 № 77-ФЗ, VeraPDF, AcrobatPro, GhostScript, пиратский PitStop и целое множество упоротых сообщений в переводе надмозга, SolidPDF, а также спецификации PDF и PDF/A, FAQ и около двух тысяч сообщений на 86 страницах соответствующего топика. Не то чтобы это был необходимый запас для проверки PDF, но если начал собирать дурь, становится трудно остановиться. Единственное, что вызывало у меня опасение — это неверная кодировка текстового слоя. Ничто в мире не бывает более беспомощным, безответственным и порочным, чем верстальщик-самоучка которому прислали 16 полос социальной рекламы от союзного государства в кривых. Я знал, что рано или поздно мы перейдем и на эту дрянь.
 
  • Спасибо
Реакции: Валера1966
юникод-кода символа вне зависимости от того, какой код он получил в сабсете.
Вроде по-русски написано, а я ничего не понял. Можете пояснить?
А заодно поясните, каким чудесным образом произойдёт сопоставление, если в пдф внедрён не весь шрифт, а символы на совсем экзотических местах?
Вы говорили, что прочли эту тему? Видели мои скриншотики? А файл, что несколько гротескно, но наглядно демонстрирует эту проблему?
Его вы подвергли своему чудесному автоматическому преобразованию? И что вышло?

Не по теме:
Я рад, что вы не только пишете тут, но ещё и что-то читаете. Кстати, сколько вас? Вы, вроде ранее говорили, что один. Что-то изменилось? Теперь вас много? Да, читаете вы хором или по-очереди?

 
А файл, что несколько гротескно, но наглядно демонстрирует эту проблему?
Его вы подвергли своему чудесному автоматическому преобразованию? И что вышло?
Если шрифт не загружен в систему - ничего не выйдет. А вот если его заменить на другой, то выйдет очень некрасивое слово '))'
 
Вроде по-русски написано, а я ничего не понял. Можете пояснить?
В понимании официального представителя юникод глифа должен каким то чудесным образом материализовываться из нихрена и вставляться на свое законное место в таблице для каждого из стопятьсот сабсетовских огрызков, внедренных в публикацию.
А в моем понимании это все равно что OCR
 
Последнее редактирование:
  • Спасибо
Реакции: Валера1966 и ~RA~
В понимании официального представителя юникод глифа должен каким то чудесным образам материализовываться из нихрена и вставляться на свое законное место в таблице для каждого из стопятьсот сабсетовских огрызков, внедренных в публикацию.
Спасибо. А разумею ровно так же, о чём пишу уже 86 страницу. ;)
 
Видишь, некоторые даже прочитав 86 страниц продолжают пребывать в счастливом неведении
Что уж говорить о тех, которых они "консультируют"
 

Не по теме:
Призываю всех участников дискуссии не вымещать тот негатив, что доставляет им обсуждаемый закон и ргб на @Lupantrop. Человек тут как лицо неофициальноt и, похоже, действительно с целью выяснения причин недовольств. Чем чёрт не шутит, может он и правду сможет сделать жизнь издателя хоть капельку легче.
 

Не по теме:
Минутка фантастики.
1) С 5.12.2019 г. РГБ объявила мораторий на приём новых обязательных электронных экземпляров до
2) установления нового порядка и формата приёма оных на основании
3) объявления всенародного обсуждения на референдуме профильных форумах и
4) приёма согласованной со всеми Инструкции по передаче ОЭЭ
[/END OF FANTASY]

 
не вымещать тот негатив, что доставляет им обсуждаемый закон и ргб на @Lupantrop.

Не по теме:
Ничуть не более, чем на тебя или других участников форума. Я, в отличие от Жоры, лицо незаинтересованное и настроенное дружелюбно '))'
 
Я, в отличие от Жоры, лицо незаинтересованное
В чём я заинтересован? Ты ещё расскажи, что мне Adobe платят за рекламу их монополии, которая очевидна даже капитану очевидность, окромя "наших".
 

Не по теме:
Вот, честно, когда говорил начальству, что "на одном из форумов" есть инструкции "как подружиться с РГБ = полсотни страниц, плюс ЧаВо в головном посте", мне не хотели верить. Откинем нетехнические посты — на вскидку полсотни страниц и останется )
 
Самый первый пост. В нём всё самое основное.
 
Можете пояснить?
А заодно поясните, каким чудесным образом произойдёт сопоставление, если в пдф внедрён не весь шрифт, а символы на совсем экзотических местах?
Вы говорили, что прочли эту тему? Видели мои скриншотики? А файл, что несколько гротескно, но наглядно демонстрирует эту проблему?
Да, скриншоты видел и файликом наслаждался. Попробую объяснить, что имею в виду...

Стандарты 2u/3u предполагают внедрение в PDF/A-файл кодов, которые соответствуют глифам в кодировке юникод. Причём это происходит, даже если шрифты сабсеттятся. По крайней мере, я так понял документацию. Естественно, чтобы эти коды там были, надо, чтобы они оттуда не пропали во время дистилляций-передистилляций. В пдфе, из которого уже всё вычистили, коды сами по себе не появятся, им уже неоткуда взяться, кроме как из OCR.

Соответственно, задача: подобрать такой набор стандарта и софта для генерации и валидации PDF/A, который бы гарантировал получение валидного файла за одну итерацию. Без необходимости шаманства с передистилляцией.
 
да проблема же не в вере этой.

а в вашей ргб-лени.

под каждым невнятным и для 99% непонятным сообщением префлайта этого ДОЛЖНО БЫТЬ ОТ РГБ:
"...для того, чтобы избежать этого сообщения, необходимо сделать следующее..."

вас же ненавидят не за веру.
а за то, что вы ничего не делаете, чтобы обычный человек мог вам сдать файл!