Обязательный электронный экземпляр и преобразование PDF в PDF/A для РГБ

vinnik63 · 07.09.2017

~RA~ сказал(а):
Да! Только не на моей, а на @_MBK_

теперь понятно...

просто я во всякие компьютерные премудрости не сразу врубаюсь...

теперь непонятно - почему мой файл прошёл автоматическую проверку, хотя в свойствах текстового слоя нигде нет магических цифр CP-1251 или UTF-8...

_MBK_ · 07.09.2017

vinnik63 сказал(а):
почему мой файл прошёл автоматическую проверку,

На этот вопрос тоже в топике был дан исчерпывающий ответ:

_MBK_ сказал(а):
Такое не на автомате делается - сидит специально обученная обезьяна с комплексом вахтера и чудит.
Пресловутый человеческий фактор

vinnik63 · 07.09.2017

_MBK_ сказал(а):
На этот вопрос тоже в топике был дан исчерпывающий ответ:

понятно... буду надеяться, что у вахтёра будет хорошее настроение...

_MBK_ · 07.09.2017

Вдобавок, вики говорит нам, что

К кодировкам «ANSI»/Windows относят, в частности, Windows-1252 и вышеупомянутую Windows-1251.

В кастомной кодировке тоже не все так просто
Ибо во внедренном подмножестве символы кириллицы могут стоять на своих местах. А могут и не стоять.
То есть, человеческий фактор в действии - попадется оператор, который глянет в свойства и завернет файл, а попадется другой который скопирует выборочный текст через клипбоард (или экспортирует) - пропустит.

~RA~ · 07.09.2017

_MBK_ сказал(а):
Ибо во внедренном подмножестве символы кириллицы могут стоять на своих местах. А могут и не стоять.

Или, например, могут стоять на своих, но только те, что используются. Тогда тоже проканает.

_MBK_ · 07.09.2017

Может проканает, а может и нет.
Мы ж не видели методичку, которую обезьянам выдают. А если она наподобие ихнего фака, то там уже самопротиворечие содержится - текст не в кодировке CP-1251 или UTF-8 вполне себе копироваться может, как хочешь так и понимай

vinnik63 · 07.09.2017

_MBK_ сказал(а):
а попадется другой который скопирует выборочный текст через клипбоард (или экспортирует) - пропустит.

попробовал скопировать и вставить в ворд, а также экспортнуть в doc -- вроде текст читается...

лишь бы других косяков не нарыли, а то уже башка кругом идёт...

Mikky · 13.09.2017

С легкой руки @_MBK_, сочинилась забавная схема, как можно лечить PDF от многих ошибок вида "хрен знает, что там произошло и ни фига не поймешь, как это можно исправить".

Здесь после каждого очередного преобразования делается проверка Префлайтовским "Verify compliance with PDF/A". Если после проверки все в порядке, то тема закрыта, если нет, то продолжаем дальше.

1. Берем проблемный PDF и для начала пропускаем его через через Префлайтовское "Convert to PDF/A".
2. Если ошибка сохранилась, то делаем из PDF PS-файл и конвертим его в Дистиллере в PDF/A.
3. Если ошибка все одно упорствует, то опять прогоняем через Префлайтовское "Convert to PDF/A".
Если эта зараза все равно не уходит, крутим по кругу, пока она окончательно не прибьется.

Вначале такое было рассчитано на ошибки типа "Абсолютное реальное значение должно быть меньше или равно 32767.0" и им подобные ([XI] - PDF Reference Таблица C.1 ("Architectural limits") - о чем там идет речь?). И на них срабатывало очень даже неплохо.
Но любопытства ради попробовал на нескольких PDF с другими ошибками - выяснилось, что и там вполне себе работает. При этом пока что для эффективного лечения вполне хватало одного круга, на второй еще ни разу уходить не приходилось.

На данный момент удалось вылечить PDF от следующих ошибок.
"Номер объекта и номер поколения разделяются однократным символом свободного места (пробела). Номер поколения и ключевое слово obj разделяются однократным символом пробела. Каждому номеру объекта и ключевому слову endobj предшествует маркер EOL. Каждое ключевое слово obj и endobj следует за маркером EOL"
"Компонент DeviceRGB может использоваться только тогда, когда файл имеет вывод намерений OutputIntent PDF/A-1, который использует цветовое пространство RGB."
"Если некалиброванное цветовое пространство используется в файле, тогда этот файл должен включать вывод намерений OutputIntent PDF/A-1, как указано в пункте 6.2.2"
"Программы для всех шрифтов, используемых в пределах соответствующего файла, должны быть вложены в этот файл, как указано в пункте 5.8 PDF Reference, за исключением того, когда шрифты используются исключительно в режиме 3 текстовой визуализации"

От ошибок текстового слоя такое "лекарство" вряд ли поможет, но многие другие обломы похоже лечит вполне успешно.

Mikky · 14.09.2017

Забыл написать - вся эта работа делалась в Акробате XI.

vinnik63 · 14.09.2017

Mikky сказал(а):
2. Если ошибка сохранилась, то делаем из PDF PS-файл и конвертим его в Дистиллере в PDF/A.

Как раз на днях пришёл к этому же способу...

После долгих безуспешных попыток построить из публикации "правильный" ПДФ с первого раза, решил плюнуть и просто вывести ПДФ повторно, и всё получилось...

Mikky сказал(а):
От ошибок текстового слоя такое "лекарство" вряд ли поможет, но многие другие обломы похоже лечит вполне успешно.

а чтобы не было проблем с текстовым слоем, конвертирую ПДФ с помощью pdf-recode101210.exe

~RA~ · 14.09.2017

Новая загадка. Как думаете, о чём это?

Все цветовые пространства ICCBased встраиваются в качестве потока профиля ICC, как указано в cпецификации PDF 4.5. Количество цветовых компонентов в цветовом пространстве, описываемого данными профиля ICC должно соответствовать реальному количеству компонентов в профиле ICC. Как в пункте PDF 1.4, N должно быть равно 1, 3, или 4

LeonidB · 14.09.2017

~RA~ сказал(а):
Новая загадка. Как думаете, о чём это?

@~RA~, ~~я не могу себе даже представить такой квадратный трёхчлен,~~ как мне кажется, надо попробовать просто в префлайте сделать Convert to sRGB из группы PDF fixups.

_MBK_ · 14.09.2017

LeonidB сказал(а):
Convert to sRGB

Спасибо Кэп, первым делом пробовали именно это.
В файле только sRGB и Indexed, базирующиеся на этом sRGB
Случай, на мой взгляд, совершенно странный. Всюду ужасы, смерть, чудеса.

LeonidB · 14.09.2017

Не по теме:

_MBK_ сказал(а):

Спасибо Кэп, первым делом пробовали именно это.

Нажмите, чтобы раскрыть...

Ну а мне-то откуда знать, что там в файле и что пробовали?

_MBK_ · 14.09.2017

LeonidB сказал(а):
Ну а мне-то откуда знать

Не по теме:
Ну ты подобными подозрениями прямо таки обижаешь Рому

~RA~ · 14.09.2017

Не-не, я не спрашиваю, как это лечить, я хочу понять о чём это.

LeonidB · 14.09.2017

~RA~ сказал(а):
Не-не, я не спрашиваю, как это лечить

А, так всё-таки вылечил? Convert to sRGB или иначе?

Не по теме:
Потому что мне как раз пофиг, о чём это, мне важнее, как лечить.

~RA~ · 14.09.2017

Я сначала подумал, что они вот об этом несоответствии:

потом, что об индексированных пространствах, потом…

~RA~ · 14.09.2017

LeonidB сказал(а):
Convert to sRGB или иначе?

Дат там и так все сРГБ было.

TRANTOR · 14.09.2017

Количество ... компонентов .. профиля ICC должно соответствовать ... количеству компонентов в профиле ICC

Маслянное масло должно быть маслянистым.

потока профиля ICC

Гуртовщики мыши.

Обязательный электронный экземпляр и преобразование PDF в PDF/A для РГБ

Участник

Пикирующий бомбардировщик

Участник

Пикирующий бомбардировщик

🄯

Пикирующий бомбардировщик

Участник

Участник

Участник

Участник

🄯

Шпационный шмотритель

Пикирующий бомбардировщик

Шпационный шмотритель

Пикирующий бомбардировщик

🄯

Шпационный шмотритель

🄯

🄯

Son of a Gun