Обязательный электронный экземпляр и преобразование PDF в PDF/A для РГБ

andrejK

R.I.P.
Сообщения
10 300
Реакции
5 218
А то у меня по ее поводу одна занятная идея возникла.
идею не знаю, но осуждаю заранее.

эта опция влияет лишь на то как будет записан постскрипт-файл.
ascii или bimary.

что после скармливания его дистиллеру перестает иметь значение.
 
  • Спасибо
Реакции: LeonidB

Mikky

Участник
Сообщения
161
Реакции
13
В PDF/A-файлах в числе прочего нельзя использовать гиперссылки. Но вот как их удалить, если в исходном PDF они есть, пока не очень понятно.
В 11-м Акробате есть операция "Удалить все ссылки". Но срабатывает она почему-то не всегда - на одном PDF вполне нормально находит и удаляет, на другом говорит "Ничего не найдено". А гиперссылки (вполне работающие) в нем есть и во вполне приличном количестве.
 

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 197
Реакции
10 847
В PDF/A-файлах в числе прочего нельзя использовать гиперссылки. Но вот как их удалить, если в исходном PDF они есть, пока не очень понятно.
В 11-м Акробате есть операция "Удалить все ссылки". Но срабатывает она почему-то не всегда - на одном PDF вполне нормально находит и удаляет, на другом говорит "Ничего не найдено". А гиперссылки (вполне работающие) в нем есть и во вполне приличном количестве.
В постскрипте никаких гиперссылок нет, поэтому Кэп подсказывает, что передистилляция и эту проблему решает.
 

George

I wish I was a monster you think I am
15 лет на форуме
Сообщения
17 323
Реакции
7 870
что передистилляция и эту проблему решает.
Может это вообще не проблема, а автоопределение Hyperlinks.

И эта галочка включена у всех по умолчанию. См. картинку.

Просто во всём мире и в Adobe не знают, что суровые челябинские мужики настолько суровые кому-то это не надо по умолчанию.
 

Вложения

  • 2017-10-03_8-55-58.png
    2017-10-03_8-55-58.png
    65.5 КБ · Просм.: 931
  • Спасибо
Реакции: Валера1966

vinnik63

Участник
Сообщения
322
Реакции
99
На этих скринах есть одна интересная настройка - "Кодирование данных". Не подскажете чем она занимается?
фиг знает, чем она занимается, там всего два пункта, причём у меня почему-то активный только первый, так что выбирать не приходится... :)

Untitled-1.jpg
 

~RA~

Одарённая.
12 лет на форуме
Сообщения
11 861
Реакции
3 450

lopuh

12 лет на форуме
Сообщения
51
Реакции
10
Поможет это кому-то или нет, но скажу. Как понимаю в настройках создания ps или sep файла в пм (ascii или binary) зависит от того на какой принтер печатается. к примеру если печатать на древний agfa avantra то я ставил send ascii image data. а например если печатать на более свежий принтер - scenic soft color - то там ставится в настройках send binary (в двоичных кодах). ну и как я заметил при печати на агфу авантру "слет кодировки" никак не убрать. Тот же самый файл тупо лечится печатью на сценик софт колор. Кодировка не слетатет. Как-то так. Я лопух. Простите еже ли чо. Сперва я думал что траббл из-за системы (икспи или вин7). Оказалось просто принтер старый... Короч для типографии то нормально печатать на агфу авантру, но кодировку для библиотеки из этого пдф (после дистиллера) ну никак... А после сценика все на ура, но пдф нужно все же перекодировщиком еще... А после агфы и перекодировщик никак не помогал...
 

Evgen

Registered User
15 лет на форуме
Сообщения
2 054
Реакции
984
Как понимаю в настройках создания ps ... зависит от того на какой принтер печатается.
Правильно понимаете.
при печати на агфу авантру "слет кодировки" никак не убрать
У вас в настройках принтера ВСЕ шрифты загружаемые?
Помнится, в нулевых у многих траблы были из-за этого (вывод PS из PageMaker'a и получение слета кодировки).
Нужно пройтись ручками по всему списку и установить "Загружаемый".
Обычно для Таймс, Ариал, и проч. было установлено "Встроенный".
 

lopuh

12 лет на форуме
Сообщения
51
Реакции
10
Правильно понимаете.

У вас в настройках принтера ВСЕ шрифты загружаемые?
Помнится, в нулевых у многих траблы были из-за этого (вывод PS из PageMaker'a и получение слета кодировки).
Нужно пройтись ручками по всему списку и установить "Загружаемый".
Обычно для Таймс, Ариал, и проч. было установлено "Встроенный".
гляну как нибудь. для интереса.
 

Mikky

Участник
Сообщения
161
Реакции
13
Но этот пример еще раз подчеркнул для меня ту непонятку, с которой я пытаюсь разобраться.
Берем шрифт, у которого перетасованы соответствия "код - символ (глиф символа)". Набираем им текст, делаем из этого текста PDF. Сколько я себе представляю создание и чтение этого PDF, видимая часть и текстовый слой при этом должны получаться одинаковыми. Или и там, и там будет "мир", или это самое, из трех букв. :)
А так, чтобы в видимой части было одно, а в текстовом слое совсем другое... Для этого надо, чтобы они формировались не по одной и той же логике, а по разным. Или данные для них брались из разных мест.

Извиняюсь за определенное занудство, но какие-то моменты обсуждаемого, которые вам, в силу опыта, ясны и очевидны, мне пока еще не настолько очевидны. По причине отсутствия этого самого опыта. Которого как раз сейчас и пытаюсь набраться. :)
 

lopuh

12 лет на форуме
Сообщения
51
Реакции
10
Правильно понимаете.

У вас в настройках принтера ВСЕ шрифты загружаемые?
Помнится, в нулевых у многих траблы были из-за этого (вывод PS из PageMaker'a и получение слета кодировки).
Нужно пройтись ручками по всему списку и установить "Загружаемый".
Обычно для Таймс, Ариал, и проч. было установлено "Встроенный".

В настройках принтера перед каждым шрифтом опцией списка стоит "не подставлять". список раскрываешь - и кроме "не подставлять" ничего более нет...
 

zaitv

Участник
Сообщения
9
Реакции
0
Добрый день!
У нас отклоняют заявки на сайте Электронной библиотеки с такой причиной
Кто, что может подсказать?
Формат из PDF в PDF/A1 меняем в Acrobat Pro
И если открывать документ в нем и копировать текст и вставлять в блокнот, то текст вставляется нормально, с проблемами и даже с такими же шрифтами.
А как они проверяют, что у них текст без пробелов ?

Причина отказа:
"Заявка на передачу ОЭК отклонена по причине несоответствия текстового слоя содержимому файла. Была введена проверка на наличие текстового слоя и его соответствие содержанию файла. Ваш PDF-файл должен иметь возможность поиска по нему. То есть представлять собой изображения страниц издания, а в отдельном слое содержать распознанный текст, каждый символ которого ссылается на соответствующий символ в изображении. Это позволит сохранить ваши издания в исходном виде и корректно представить информацию, содержащуюся в них.
Ошибка возникает из-за особенностей настройки вашего оборудования.
Для решения данной проблемы рекомендуем обратиться в службу технической поддержки вашей организации. Всю необходимую информацию вы можете найти на странице помощи, расположенной по адресу:В текстовом слое присланного Вами PDF-файла следующее:"
кжеюныеучас
тни
киме
роприя
тияпосмо
трелипра
зднич
нуюпро
грамму
,посоревновались
вкон
курсах

знали
,чему можно
 

~RA~

Одарённая.
12 лет на форуме
Сообщения
11 861
Реакции
3 450
Файл покажите.
 

zaitv

Участник
Сообщения
9
Реакции
0

Вот который выходит с InDesign: ссылка
А вот PDF/A после Acrobat Pro: ссылка
в Acrobat приходится сначала преобразовать в 1b, потом только в 1a, только так принимает автоматика в библиотеке, а вот выше ошибка приходит уже после проверки оператора.
 

JAW

15 лет на форуме
Сообщения
15 797
Реакции
3 454
Вот не хочется всего читать проверять...
А никто не предлагал распознать Fine Reader в режиме картинки и сохранить в PDF/A?

Или бесплатным, как его... CuneiForm?
 

lev

Модератор
20 лет на форуме
Сообщения
2 145
Реакции
2 071
Тады уж лучше ABBYY PDF Transformer, он обещается создать/пересоздать текстовый слой в готовом pdf. В т.ч. и рекламки растрированные распознаются и.т. п. А с FineReader'ом ещё возиться придётся. Или в новых версиях он включает данный функционал?