Обязательный электронный экземпляр и преобразование PDF в PDF/A для РГБ

  • Автор темы Автор темы BorA
  • Дата начала Дата начала
Да! Только не на моей, а на @_MBK_
теперь понятно... :) просто я во всякие компьютерные премудрости не сразу врубаюсь... :)
теперь непонятно - почему мой файл прошёл автоматическую проверку, хотя в свойствах текстового слоя нигде нет магических цифр CP-1251 или UTF-8... :)
Untitled-1.jpg
 
почему мой файл прошёл автоматическую проверку,
На этот вопрос тоже в топике был дан исчерпывающий ответ:
Такое не на автомате делается - сидит специально обученная обезьяна с комплексом вахтера и чудит.
Пресловутый человеческий фактор
 
  • Спасибо
Реакции: vinnik63
Вдобавок, вики говорит нам, что
К кодировкам «ANSI»/Windows относят, в частности, Windows-1252 и вышеупомянутую Windows-1251.
В кастомной кодировке тоже не все так просто
Ибо во внедренном подмножестве символы кириллицы могут стоять на своих местах. А могут и не стоять.
То есть, человеческий фактор в действии - попадется оператор, который глянет в свойства и завернет файл, а попадется другой который скопирует выборочный текст через клипбоард (или экспортирует) - пропустит.
 
Ибо во внедренном подмножестве символы кириллицы могут стоять на своих местах. А могут и не стоять.
Или, например, могут стоять на своих, но только те, что используются. Тогда тоже проканает.
 
Может проканает, а может и нет.
Мы ж не видели методичку, которую обезьянам выдают. А если она наподобие ихнего фака, то там уже самопротиворечие содержится - текст не в кодировке CP-1251 или UTF-8 вполне себе копироваться может, как хочешь так и понимай
 
Последнее редактирование:
  • Спасибо
Реакции: Mikky
а попадется другой который скопирует выборочный текст через клипбоард (или экспортирует) - пропустит.
попробовал скопировать и вставить в ворд, а также экспортнуть в doc -- вроде текст читается... :) лишь бы других косяков не нарыли, а то уже башка кругом идёт... :)
 
С легкой руки @_MBK_, сочинилась забавная схема, как можно лечить PDF от многих ошибок вида "хрен знает, что там произошло и ни фига не поймешь, как это можно исправить". :)

Здесь после каждого очередного преобразования делается проверка Префлайтовским "Verify compliance with PDF/A". Если после проверки все в порядке, то тема закрыта, если нет, то продолжаем дальше.

1. Берем проблемный PDF и для начала пропускаем его через через Префлайтовское "Convert to PDF/A".
2. Если ошибка сохранилась, то делаем из PDF PS-файл и конвертим его в Дистиллере в PDF/A.
3. Если ошибка все одно упорствует, то опять прогоняем через Префлайтовское "Convert to PDF/A".
Если эта зараза все равно не уходит, крутим по кругу, пока она окончательно не прибьется. :)

Вначале такое было рассчитано на ошибки типа "Абсолютное реальное значение должно быть меньше или равно 32767.0" и им подобные ([XI] - PDF Reference Таблица C.1 ("Architectural limits") - о чем там идет речь?). И на них срабатывало очень даже неплохо.
Но любопытства ради попробовал на нескольких PDF с другими ошибками - выяснилось, что и там вполне себе работает. При этом пока что для эффективного лечения вполне хватало одного круга, на второй еще ни разу уходить не приходилось.

На данный момент удалось вылечить PDF от следующих ошибок.
"Номер объекта и номер поколения разделяются однократным символом свободного места (пробела). Номер поколения и ключевое слово obj разделяются однократным символом пробела. Каждому номеру объекта и ключевому слову endobj предшествует маркер EOL. Каждое ключевое слово obj и endobj следует за маркером EOL"
"Компонент DeviceRGB может использоваться только тогда, когда файл имеет вывод намерений OutputIntent PDF/A-1, который использует цветовое пространство RGB."
"Если некалиброванное цветовое пространство используется в файле, тогда этот файл должен включать вывод намерений OutputIntent PDF/A-1, как указано в пункте 6.2.2"
"Программы для всех шрифтов, используемых в пределах соответствующего файла, должны быть вложены в этот файл, как указано в пункте 5.8 PDF Reference, за исключением того, когда шрифты используются исключительно в режиме 3 текстовой визуализации"

От ошибок текстового слоя такое "лекарство" вряд ли поможет, но многие другие обломы похоже лечит вполне успешно.
 
  • Спасибо
Реакции: Валера1966
Забыл написать - вся эта работа делалась в Акробате XI.
 
2. Если ошибка сохранилась, то делаем из PDF PS-файл и конвертим его в Дистиллере в PDF/A.
Как раз на днях пришёл к этому же способу... :)
После долгих безуспешных попыток построить из публикации "правильный" ПДФ с первого раза, решил плюнуть и просто вывести ПДФ повторно, и всё получилось... :)

От ошибок текстового слоя такое "лекарство" вряд ли поможет, но многие другие обломы похоже лечит вполне успешно.
а чтобы не было проблем с текстовым слоем, конвертирую ПДФ с помощью pdf-recode101210.exe :)
 
Новая загадка. Как думаете, о чём это?
Все цветовые пространства ICCBased встраиваются в качестве потока профиля ICC, как указано в cпецификации PDF 4.5. Количество цветовых компонентов в цветовом пространстве, описываемого данными профиля ICC должно соответствовать реальному количеству компонентов в профиле ICC. Как в пункте PDF 1.4, N должно быть равно 1, 3, или 4
 
Новая загадка. Как думаете, о чём это?
@~RA~, я не могу себе даже представить такой квадратный трёхчлен, как мне кажется, надо попробовать просто в префлайте сделать Convert to sRGB из группы PDF fixups.
 
Спасибо Кэп, первым делом пробовали именно это.
В файле только sRGB и Indexed, базирующиеся на этом sRGB
Случай, на мой взгляд, совершенно странный. Всюду ужасы, смерть, чудеса.
 
Не-не, я не спрашиваю, как это лечить, я хочу понять о чём это.
 
Не-не, я не спрашиваю, как это лечить
А, так всё-таки вылечил? Convert to sRGB или иначе?

Не по теме:
Потому что мне как раз пофиг, о чём это, мне важнее, как лечить. :)
 
Я сначала подумал, что они вот об этом несоответствии:
Скриншот 2017-09-14 16.20.35.png
потом, что об индексированных пространствах, потом…
 
  • Спасибо
Реакции: glugoff