обрезка PDF по заранее заготовленной рамке

  • Автор темы Автор темы Z_Felix
  • Дата начала Дата начала
Статус
Закрыто для дальнейших ответов.
Z

Z_Felix

Гость
Топикстартер
Здравствуйте,
Прошу совета гуру. В настоящее время используется сканер от машины XEROX 6279 и программа Rasterid 3.6. Проблема в том что XEROX 6279 формирует очень странные PDF файлы которые не может открывать Rasterid 3.6, а CSOFT забил на поддержку своего продукта.
Алгоритм работы такой:
На сканере сканируются чертежи формата от A4x3 до А0, их требуется выравнивать и и что самое главное обрезать по шаблонам(готовый прямоугольник работающий как гелятина отсекающая все лишнее по сторонам) например 297х610 итп. В настоящее время приходиться сканировать в TIFF обрезать и пересохранять в PDF. Интерфейс у Rasterid 3.6 настолько убогий что вот это самое каждый раз пересохранение в PDF тысячу раз за день отнимает очень много времени и просто надоедает. Так вот требуется точно такой же функционал что у Rasterid 3.6 но для прямой обработки PDF. Что можете посоветовать? Как можно автоматизировать процесс обрезки например группы файлов? Самое главное чтобы конечный размер растра не был меньше или больше например шаблона 297х610 и при этом соотношение чистых полей по краям было бы симметричным.


Гуру ПДФ может подскажите что может быть не так с пдф файлами которые делает аппарат xerox? Ошибка при открытии в Rasterid 3.6 чтото типо "ошибка цветопередачи растра". Пытался эти ПДФ предохраняться с разные версии PDF, на определенных чертеж открывается в программе но там гдето 1/3 его отображается. Версия пдф которую делает xerox 1.4
 
А чем родной акробат не подходит?
 
А чем родной акробат не подходит?

Не подскажете как именно обрезать по заготовленным шаблонам? На первый взгляд вижу только ручной метод выделил как получилось и обрезал , но никакой точности. В моем случаи идет обработка чертежей в рамках, которые в последствии приходиться печатать.
 
вот прикинь специально не стал править слово хотя подчеркнуло его, и как оказался прав, точно нашелся википедист на форуме
Прикидываю, что с такой манерой общения вы недолго здесь продержитесь :).
 
На первый взгляд вижу только ручной метод выделил как получилось и обрезал , но никакой точности.
Ну почему же никакой точности? Вы внимательно изучили диалоговое окно Crop page? Причем, автоматизируется элементарно.

Прикидываю, что с такой манерой общения вы недолго здесь продержитесь

Не по теме:
Наглость - второе счастье.
Хотя нет, похоже, топикстартеру счастья не принесла.

'))'
 
Z_Felix said: ↑
На первый взгляд вижу только ручной метод выделил как получилось и обрезал , но никакой точности.
Ну почему же никакой точности? Вы внимательно изучили диалоговое окно Crop page? Причем, автоматизируется элементарно.
Помогите советом, я столкнулся с такой проблемой. После распознавания ClearScan производится наклон (автовыравнивание) изображений, в результате по краям страниц появляются скошеные белые поля размером несколько мм. Проходится делать обрезку инструментом Crop. Причем, для каждой страницы индивидуально. Но дело в том, что стандартный инструмент Crop не позволяет управлять выделением, как PhotoShop, можно тянуть только за углы прямоугольника, а за ребра - нельзя. В результате снижается точность выделения. Подскажите, есть ли более продвинутый инструмент для обрезки pdf, если не в Acrobat, то в плагинах или другом софте?
 
Или как хотя бы обрезать по уму... Каждый раз вызывать окно стандартного Crop и указывать размеры cropbox в mm? При этом каждый раз учитывать размеры предыдущей обрезки этой же страницы и добавлять их в уме к уже введенным - ну просто жесть :)
 
А так подойдет?
Делай раз
1.jpg

Делай два
2.jpg
 
  • Спасибо
Реакции: Aniriann
Тут еще есть один нюанс, касаемый выбора инструмента для обрезки PDF страниц - стандартный Acrobat'овский инструмент обрезки Pages > Crop не обладает такими возможностями, как скажем PhotoShop Rectangular Marquee Tool, т.к. позволяет тянуть выделение только за опорные точки в углах выделения, а не за бока, как в RMT. Даже сторонний специализированный софт, например, такой как VeryPDF PDFCrop, A-PDF page Crop не дотягивает до RMT, а лишь добавляет еще 4 опорные точки на середине ребер для изменения выделения. так что приготовьтесь к тому, что если вы хотите точно обрезать pdf страницу, придется либо ковыряться с линейками, либо иметь 2 4K монитора.

PS: Спасибо, разобрался. Инструмент Page Crop действительно удобен, если знать, как им пользоваться. Я сделал так. Есть такая волшебная клавиша CTRL-SHIFT-T. Она открывает окно инструмента Crop с заранее подготовленной рамкой по размеру страницы (области CropBox, в отличие от TrimBox, ArtBox).
но сначала надо растянуть окно Acrobat на 2 монитора по вертикали (я использую для этого Actual Multiple Monitors), чтобы более менее было видно белые скосы распознанного скана, и сделать View - Page Display - Single Page View. Конечно, 4K не скоро по разумной цене появятся, но хотя бы так. А далее все просто, переходим хоткеем, например ALT-R, в правое поле Right окна Set Page Boxes и стрелками Up-Down делаем приращение на выбранную ед. измерения. По умолчанию стоят дюймы и приращение с шагом в 0.125 in может оказаться слишком большим. Чтобы установить другую ед. измерения по умолчанию для окна Set Page Boxes инструмента Crop, зайдите в Edit - Preferences - General - Units & Guides. Если вы выберите здесь Page & Ruler Units: Points, вы сделаете меньший шаг в Set Page Boxes, но придется терпеть Points. Выбор других параметров в этом окне не влияет на уменьшение шага приращения обрезки. Если это необходимо, задавайте шаг вручную. Если кто знает, как делать приращение по 0,25 мм, напишите, плиз.

PS: У кого нет двух мониторов, Adobe как бы намекает, мол не обессудьте и работайте с меньшим масштабом. А знаете почему? Потому что если вызвать окно Set Page Boxes, страница не прокручивается! :(
 
Последнее редактирование:
А что мешает обработать скан в ФШ? Программа прекрасно справляется с пдф...
 
Первый поворот делаем PShop, второй ClearScan, причем последний не позволяет это отключить. При повторном повороте изображение размыливается. У меня на ум приходит только одна мысль, - ClearScan вращает изображение в области CropBox PDF-страницы в результате процесса распознавания, чтобы выровнять его относительно горизонтально расположенного распознанного текста и не дает пользователю оставить текст наклонным. В результате по краям страницы появляются белые углы, которые портят внешний вид книги. И если для книг, отпечатанных на белом фоне это не видно, то для цветных иллюстраций, например, журналов это неприемлемо, - приходится подрезать края PDF страницы, чтобы белые углы скрыть.

Необходимо довести до Adobe R&D эту информацию.

Мне, кстати, надоело вращать изображение вручную в PShop с помощью Ruler Tool, я отдал эту функцию на откуп FineReader. ScanTailor меня не устроил, ИМХО FineReader лучше выполняет автоповорот, и скорее всего потому, что он предварительно распознает строки и делает вращение относительно текста, хотя это только мое предположение.
 
Последнее редактирование:
Не имеет смысл вращать дважды изображение дважды, даже если оно 600 dpi, - это приводит к потере качества. Т.к. ClearScan вращает автоматически, Photoshop не имеет смысла использовать.

Еще один момент, который касается обрезки PDF-страниц, - это чистка PDF-файла от невидимых областей изображений, выходящих за область CropBox. Тут где-то на форуме сообщалось, что для этого необходимо сохранить файл как PostScript и прогнать его в PDF через Distiller. Но в случае документа, распознанного ClearScan, входные изображения из lossless ZIP формата (если вы импортировали в PDF TIFF'ы) конвертируются в основном в JPEG. И чтобы обрезать JPEG, в конфигурации профиля joboptions Distiller необходимо определить выходной формат изображений, подлежащих обрезке и если мы выставляем ZIP или lossless JPEG-2000, то это приводит к неоправданно большому раздутию файла PDF, а если мы поставим JPEG-2000 med или JPEG High, то получим JPEG'нутый JPEG, что опять сказывается на качестве выходного PDF файла. Никакой речи об использовании алгоритма JPEGTrain и речи не идет.

Пока Adobe не почешет затылок и не позволить контролировать пользователю в ClearScan параметры наклона Deskew, коррекции уровней, и главное, выходной формат распознанных изображений, никаких подвижек в улучшении качетва документа PDF не предвидится.
 
Примерно так:
ClearScan_new.jpg

Да и разрешение распознавания давно пора увеличить до 1200 dpi - 4K экраны не за горами:
ClearScan_new_2.jpg
 
Чтобы увеличить разрешение в текущей версии, можно использовать один трюк:
 

Вложения

Статус
Закрыто для дальнейших ответов.