[Acr XI] Вопросы по созданию PDF/A через FineReader v14 по v16

Есть подозрение, что в FR не удастся без танцев с бубном убрать сжатие... искал способ халявно, быстро и одной кнопкой :)

Ну вот так...
PDF/A кстати, требование?
Да, нужен архивный PDF..
Нужно чтобы человек с минимальным набором знаний мог настраивать OCR и сборку PDF из подготовленных исходников.
Короче юзерфрендли софт...
 
Нужно чтобы человек с минимальным набором знаний мог настраивать OCR и сборку PDF из подготовленных исходников.
Настраивать должен настройщик, а пользоваться пользователь.
Кстати про величину файлов, если немного пожертвовать глубиной цвета, то можно неплохо съэкономить места.
 

Вложения

создал файл с изображениями из тиф,

cpdf
pdf из изображений из tif тоже cpdf? Потому что jpeg'и разные, png вижу, а работу с tiff в нем не вижу.
потому что так-то да. -draft , потом сливаем тифы -merge, потом -combine-page.
Только вот тифы cpdf не берет на входе, судя по мануалу
 
Последнее редактирование:
можно неплохо съэкономить места.
И все же я немного недопонимаю, какое отношение ваши достижения имеют к задаче ТСа. В файлах Тса слой с подрезанными картинками и сверху слой с текстом распознанным.
1734980356639.png

В ваших файлах голые картинки. Это не совсем то же самое, как мне кажется
 
Акробатом, но можно img2pdf так что не принципиально :)
не, ну это читерство :) а то я уже думаю, я где-то заблудился.
И еще момент - а можем ли мы гарантировать, что при объединении тифов в pdf страницы получатся в верном порядке? Потому что порядок передачи файлов в cmd/bat не определен. То есть в ручном режиме без проблем, но вот массовая обработка может пойти совсем не так
 
Последнее редактирование:
Не вижу препятствий... в FR TC тоже пакетно тащит, значит в именах файлов учтено.
Я бы на это не полагался. Никаких гарантий порядка передачи файлов нет.
Вероятно, FR оптимизирует порядок имен при импорте файлов, cmd при перечислении не делает этого гарантированно
 
cmd при перечислении не делает этого гарантированно
Я не говорил про cmd :) Но даже в нем думаю можно алгоритм сортировки сделать, чтобы соответствовала заданному. Более того, я бы изначально сначала собирал в pdf, потом тащил это в FR... и нет никаких расхождений...
 
Последнее редактирование:
как-то так
Я не говорил про cmd :) Но даже в нем думаю можно алгоритм сортировки сделать, чтобы соответствовала заданному. Более того, я бы изначально сначала собирал в pdf, потом тащил это в FR... и нет никаких расхождений...
Мне этот вариант тоже больше нравится, я его еще на первой, кажется, странице предлагал.
Вот что получилось у меня.
Меня другое смущает. У Тса не PDF/A файл, у него там слои используются, а это недопустимо для pdf/a.
Проверку префлайтом акробатовским он не проходит.
Мой, кстати, проходит
 

Вложения

Последнее редактирование:
Насколько я понял у ТС не прокатывает, или он не понял вопроса :) Тут вопрос на каком этапе у него жмется растр... при пакетном импорте или при экспорте...
 
Тут вопрос на каком этапе у него жмется растр... при пакетном импорте или при экспорте...
Мне другое интересно. Для него это вопрос академический или принципиально-рабочий? Потому что эти его серые пятнышки в файле я довольно долго искал, на отображение/чтение/печать они практического влияния не имеют. в чём смысл заморочки? Ну, если вопрос академический, то да, а так - не понимаю, зачем весь сыр-бор
 
Кстати, грустно, что cpdf не умеет флатить слои. Я списывался с John Witington, директором Coherent Graphics Ltd, по этому поводу (ну и по другим тоже), сказал, планы есть, но планов всяких много, поэтому когда сделаем нормальную работу с Optional Content Groups (слоями) - неизвестно. А жаль
 
все слои в один слить можно...
неа.
cpdf -ocg-list in.pdf
cpdf -ocg-rename -ocg-rename-from <a> -ocg-rename-to <b> in.pdf -o out.pdf
cpdf -ocg-order-all in.pdf -o out.pdf
cpdf -ocg-coalesce-on-name in.pdf -o out.pdf

-ocg-coalesce-on-name сливает слои с одинаковыми именами, которые могли образоваться, например, при объединении файлов. Именно что возможность добавить команду объединения слоев есть, и она, в приниципе, реализована, но как-то не до конца.
Зато при этом реализовано переименование ocg. Зачем это может быть так уж нужно - непонятно. Вот лично мне интересно флатить и переключать режимы работы слоя - видимость и печатаемость
 
Последнее редактирование:

Не по теме:

Да-ну?:)

Назначить всем одно имя и слить в один? :)
Ну только вот если только таким, немного черезж... способом. Получить список через -ocg-list , потом все переименовать через -ocg-rename, потом -ocg-coalesce-on-name. Ну, наверное, так получится, согласен, вы правы. Чет мы в офтопик ушли, но зато полезную идею вы мне подали. Хотя лично меня больше интересуют переключения видимости/печатаемости слоя

 
Последнее редактирование: