Обязательный электронный экземпляр и преобразование PDF в PDF/A для РГБ

vinnik63

Участник
Сообщения
322
Реакции
99
Да! Только не на моей, а на @_MBK_
теперь понятно... :) просто я во всякие компьютерные премудрости не сразу врубаюсь... :)
теперь непонятно - почему мой файл прошёл автоматическую проверку, хотя в свойствах текстового слоя нигде нет магических цифр CP-1251 или UTF-8... :)
Untitled-1.jpg
 

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 229
Реакции
10 851
почему мой файл прошёл автоматическую проверку,
На этот вопрос тоже в топике был дан исчерпывающий ответ:
Такое не на автомате делается - сидит специально обученная обезьяна с комплексом вахтера и чудит.
Пресловутый человеческий фактор
 
  • Спасибо
Реакции: vinnik63

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 229
Реакции
10 851
Вдобавок, вики говорит нам, что
К кодировкам «ANSI»/Windows относят, в частности, Windows-1252 и вышеупомянутую Windows-1251.
В кастомной кодировке тоже не все так просто
Ибо во внедренном подмножестве символы кириллицы могут стоять на своих местах. А могут и не стоять.
То есть, человеческий фактор в действии - попадется оператор, который глянет в свойства и завернет файл, а попадется другой который скопирует выборочный текст через клипбоард (или экспортирует) - пропустит.
 

~RA~

Одарённая.
12 лет на форуме
Сообщения
11 909
Реакции
3 460
Ибо во внедренном подмножестве символы кириллицы могут стоять на своих местах. А могут и не стоять.
Или, например, могут стоять на своих, но только те, что используются. Тогда тоже проканает.
 

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 229
Реакции
10 851
Может проканает, а может и нет.
Мы ж не видели методичку, которую обезьянам выдают. А если она наподобие ихнего фака, то там уже самопротиворечие содержится - текст не в кодировке CP-1251 или UTF-8 вполне себе копироваться может, как хочешь так и понимай
 
Последнее редактирование:
  • Спасибо
Реакции: Mikky

vinnik63

Участник
Сообщения
322
Реакции
99
а попадется другой который скопирует выборочный текст через клипбоард (или экспортирует) - пропустит.
попробовал скопировать и вставить в ворд, а также экспортнуть в doc -- вроде текст читается... :) лишь бы других косяков не нарыли, а то уже башка кругом идёт... :)
 

Mikky

Участник
Сообщения
161
Реакции
13
С легкой руки @_MBK_, сочинилась забавная схема, как можно лечить PDF от многих ошибок вида "хрен знает, что там произошло и ни фига не поймешь, как это можно исправить". :)

Здесь после каждого очередного преобразования делается проверка Префлайтовским "Verify compliance with PDF/A". Если после проверки все в порядке, то тема закрыта, если нет, то продолжаем дальше.

1. Берем проблемный PDF и для начала пропускаем его через через Префлайтовское "Convert to PDF/A".
2. Если ошибка сохранилась, то делаем из PDF PS-файл и конвертим его в Дистиллере в PDF/A.
3. Если ошибка все одно упорствует, то опять прогоняем через Префлайтовское "Convert to PDF/A".
Если эта зараза все равно не уходит, крутим по кругу, пока она окончательно не прибьется. :)

Вначале такое было рассчитано на ошибки типа "Абсолютное реальное значение должно быть меньше или равно 32767.0" и им подобные ([XI] - PDF Reference Таблица C.1 ("Architectural limits") - о чем там идет речь?). И на них срабатывало очень даже неплохо.
Но любопытства ради попробовал на нескольких PDF с другими ошибками - выяснилось, что и там вполне себе работает. При этом пока что для эффективного лечения вполне хватало одного круга, на второй еще ни разу уходить не приходилось.

На данный момент удалось вылечить PDF от следующих ошибок.
"Номер объекта и номер поколения разделяются однократным символом свободного места (пробела). Номер поколения и ключевое слово obj разделяются однократным символом пробела. Каждому номеру объекта и ключевому слову endobj предшествует маркер EOL. Каждое ключевое слово obj и endobj следует за маркером EOL"
"Компонент DeviceRGB может использоваться только тогда, когда файл имеет вывод намерений OutputIntent PDF/A-1, который использует цветовое пространство RGB."
"Если некалиброванное цветовое пространство используется в файле, тогда этот файл должен включать вывод намерений OutputIntent PDF/A-1, как указано в пункте 6.2.2"
"Программы для всех шрифтов, используемых в пределах соответствующего файла, должны быть вложены в этот файл, как указано в пункте 5.8 PDF Reference, за исключением того, когда шрифты используются исключительно в режиме 3 текстовой визуализации"

От ошибок текстового слоя такое "лекарство" вряд ли поможет, но многие другие обломы похоже лечит вполне успешно.
 
  • Спасибо
Реакции: Валера1966

Mikky

Участник
Сообщения
161
Реакции
13
Забыл написать - вся эта работа делалась в Акробате XI.
 

vinnik63

Участник
Сообщения
322
Реакции
99
2. Если ошибка сохранилась, то делаем из PDF PS-файл и конвертим его в Дистиллере в PDF/A.
Как раз на днях пришёл к этому же способу... :)
После долгих безуспешных попыток построить из публикации "правильный" ПДФ с первого раза, решил плюнуть и просто вывести ПДФ повторно, и всё получилось... :)

От ошибок текстового слоя такое "лекарство" вряд ли поможет, но многие другие обломы похоже лечит вполне успешно.
а чтобы не было проблем с текстовым слоем, конвертирую ПДФ с помощью pdf-recode101210.exe :)
 

~RA~

Одарённая.
12 лет на форуме
Сообщения
11 909
Реакции
3 460
Новая загадка. Как думаете, о чём это?
Все цветовые пространства ICCBased встраиваются в качестве потока профиля ICC, как указано в cпецификации PDF 4.5. Количество цветовых компонентов в цветовом пространстве, описываемого данными профиля ICC должно соответствовать реальному количеству компонентов в профиле ICC. Как в пункте PDF 1.4, N должно быть равно 1, 3, или 4
 

LeonidB

Их бин
10 лет на форуме
Сообщения
2 470
Реакции
1 530
Новая загадка. Как думаете, о чём это?
@~RA~, я не могу себе даже представить такой квадратный трёхчлен, как мне кажется, надо попробовать просто в префлайте сделать Convert to sRGB из группы PDF fixups.
 

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 229
Реакции
10 851
Спасибо Кэп, первым делом пробовали именно это.
В файле только sRGB и Indexed, базирующиеся на этом sRGB
Случай, на мой взгляд, совершенно странный. Всюду ужасы, смерть, чудеса.
 

LeonidB

Их бин
10 лет на форуме
Сообщения
2 470
Реакции
1 530

~RA~

Одарённая.
12 лет на форуме
Сообщения
11 909
Реакции
3 460
Не-не, я не спрашиваю, как это лечить, я хочу понять о чём это.
 

LeonidB

Их бин
10 лет на форуме
Сообщения
2 470
Реакции
1 530
Не-не, я не спрашиваю, как это лечить
А, так всё-таки вылечил? Convert to sRGB или иначе?

Не по теме:
Потому что мне как раз пофиг, о чём это, мне важнее, как лечить. :)
 

~RA~

Одарённая.
12 лет на форуме
Сообщения
11 909
Реакции
3 460
Я сначала подумал, что они вот об этом несоответствии:
Скриншот 2017-09-14 16.20.35.png
потом, что об индексированных пространствах, потом…
 

TRANTOR

Son of a Gun
R.I.P.
Сообщения
4 566
Реакции
2 956
  • Спасибо
Реакции: glugoff