Сканирование средствами Adobe Acrobat 9 Pro

Статус
Закрыто для дальнейших ответов.

anatoliy

Участник
Топикстартер
Сообщения
1
Реакции
0
Здравствуйте, уважаемые участники форума Дизайн и Вёрстка | Adobe Acrobat и PDF

Преамбула

Ищу помощи у опытных специалистов, сканирующих документы средствами Adobe Acrobat 9 Pro, для оптимизации соотношения качество/размер файла.

Передо мной стоит задача сформировать Data Room для предстоящей сделки IPO. Для этого необходимо отсканировать массив юридических, и иных документов: (1) договоры/контракты с подписями и печатями, (2) поэтажные планы БТИ, (3) кадастровые планы земельных участков, (4) правоустанавливающие документы – свидетельства, государственные акты, - с подписями и печатями, (5) лицензии и разрешения, и т.п.

Я принял решение сканировать в цвете, с разрешением 300 dpi, поскольку впоследствии документы будут анализироваться иностранными юристами, а у них существует негласная традиция и этикет сканировать документы, содержащие хотя бы один цветной элемент (оттиск печати, подпись, логотип) в цвете, а не ЧБ.

Сканер - Gestetner Aficio MP C2030, сканирование предполагается с помощью его родного TWAIN драйвера для использования опций по ориентации, направления текста, контрасту, и т.п.

Сохраняться документы должны в PDF для последующей их загрузки в виртуальную комнату данных, например iDeals Solutions.

Я принял решение сканировать с помощью Adobe Acrobat 9 Pro: File -> Create PDF -> From Scanner -> Custom Scan (для вызова родного интерфейса сканера).

Вопрос №1

С этого места мне не ясно, какие опции необходимо выставлять для получения максимально качественной скан-копии при минимальном размере файла для целей его последующего отображения на экране и печати на принтере. Т.е. какой будет уместен компромисс между качеством и размером?

Идя в окне Custom Scan в секцию Document кнопка Options выходим в окно Optimization Option. Вот здесь я не знаю, какие опции необходимо выставить в Custom Settings и Filtering для достижения моей цели.

Вопрос №2

Может быть, есть смысл сканировать в максимальном качестве, понимая при этом, что потом будет запущен Advanced -> PDF Optimizer для оптимизации? Но, опять же, я не знаю, какие опции необходимо выставить в PDF Optimizer. Здесь мне необходим совет опытных специалистов.

Вопрос №3

Возможно ли в Adobe Acrobat 9 Pro автоматизировать повторяющиеся действия (макрос, скрипт, или сценарий как у ABBYY FineReader)? Т.е. чтобы нажатием одной кнопкой на панели инструментов выполнялась такая последовательность:
File -> Create PDF -> From Scanner -> Custom Scan -> сканирование (и оптимизация, если надо) -> Save

Попытался создать Batch Sequence, но не нашел нужных команд.

Вопрос №4

Иногда приходится оптимизировать большие PDF файлы инструментом Document -> Reduce File Size. Чем отличается этот инструмент от Document ->Optimize Scanned PDF?

Заранее всем благодарен за помощь.

Анатолий.
 

ch_alex

Погулять вышел.
15 лет на форуме
Сообщения
8 420
Реакции
2 709
Ответ: Сканирование средствами Adobe Acrobat 9 Pro

Ничего конкретно говорить не стану. Всё же Ваш проект, не мой.

Но в основе лежит принцип необходимой достаточности. Прежде всего следует отсканировать один и тот же документ в разных разрешениях и решить для себя - что подходит. Любое растровое изображение, не содержащее объектов, имеющих описание, занимает ровно столько, сколько занимает места в памяти описание одного пикселя, умноженное на их суммарное количество. Т.е. отсканированное изображение состоит из двумерного массива пикселей, каждый из которых кодируется в 3 цвета (RGB) по 8 бит на цвет, т.е. по 3 однобайтных слова (байта) на пиксель. Это не считая служебной информации, которой можно пренебречь ввиду её малости.

Зная размер отсканированной страницы и её разрешение, Вы можете легко вычислить объём файла изображения. Скажем, А4 в RGB 8 бит c разрешением 300 ppi занимает теоретически 210*297/(25,4/300)^2*3=26101898 байт или 24,893 мегабайта. Согласитесь, это немало. Надеюсь, происхождение всех цифр в уравнении понятно.

Но при таких заметных объёмах на помощь приходят методы сжатия. В Акробате есть возможность выбора ZIP/JPEG. Первый метод обладает умеренной степенью сжатия, но характеризуется полным отсутствие вносимых артефактов. Подразумевается, что искажения первого уровня (замыленность и искажение цвета) неустранимы и зависят только от параметров сканера и настроек сканирования в TWAIN-драйвере.

Второй может давать более высокие сжатия, однако необратимо искажает изображение, внося артефакты, которые крайне трудно устранить. Этот метод обладает регулированием степени сжатия. В Акробате регулировки уровня сжатия свели к выбору нескольких пунктов. Вносимые артефакты могут не только исказить геометрию мелких объектов в сканированном изображении, но и привести к локальным изменениям цвета и появлению заметной сетчатой структуры.

В тои м другом случае конечный размер изображения в мегабайтах в точности предсказать невозможно, потому что эффективность сжатия определяется характером изображения. Сложные неповторяющиеся текстуры вообще с трудом поддаются сжатию. Но документы без водяных знаков ужмутся процентов на 30-50 в случае ZIP-сжатия и раза в 3 в случае с JPEG. Реальные цифры Вы можете определить сами - сканер и Акробат Вам в руки.

Если используется метод уменьшения размера файла, то в основе лежат методы понижения разрешения, использования более "агрессивного" сжатия и переход к цветовой модели с наименьшим объёмом кодирования элемента изображения. Например, снижение разрешения до 250 ppi, JPEG Medium/CCIT4, RGB/Gray/(Bitmap - 1200 ppi). Последние две модели - переход к 8-разрядному или одноразрадному кодированию изображения (с потерей цвета).

Надеюсь, с остальным разобраться можно. Я, к сожалению, готового решения дать просто не могу - не встречалось.

Насколько я понимаю, готовые решения имеют весьма ощутимую коммерческую стоимость. Как и адвокатские услуги. ;)
 
Статус
Закрыто для дальнейших ответов.