Потеря качества изображений после использования ClearScan

  • Автор темы Автор темы xseed
  • Дата начала Дата начала
Статус
Закрыто для дальнейших ответов.
То есть, я правильно понимаю, что если принудительно перевести в акробате все встроенные изображения в ZIP компрессию, то Clearscan все равно при обработке перекорежит их в JPEG low-medium и помешать этому невозможно, поскольку опция отсутствует?
Совершенно верно.
Да ладно. Не беда, пусть обрезки хранятся в самом PDF файле. Все равно они за областью CropBox не видны. Недостаток есть, конечно, файл увеличится в размере, процентов на 15-20, но никуда не деться.
 
Последнее редактирование:
Последнее редактирование:
Не беда, пусть обрезки хранятся в самом PDF файле.
Стоп! Я снова нихт ферштейн
А при чем тут обрезки растрового изображения и алгоритм компрессии ClearScan? Это ж совершенно другой вопрос?
 
Просто xseed говорил, что если кропнуть файл (ctrl+shift+T), но не перегонять ps-pdf, то ничего такого не происходит.
 
Не пойму, так ему просто кропнуть надо или пережать ClearScanом да еще и с собственными хитроделанными настройками??? %8
 
Не пойму, так ему просто кропнуть надо или пережать ClearScanом да еще и с собственными хитроделанными настройками??? %8

Кроппинг страниц я делаю, естественно, после ClearScan, т.к. ClearScan в результате своей работы делает Deskew изображения и появляются белые скосы по краям страницы. Deskew, к сожалению, в настройках ClearScan также нельзя отключить, как и остальные этапы.

Вот эти кропнутые обрезки я и пытаюсь вычистить с помощью перегона PostScript + Distiller, но как я говорил выше, это приводит к повторному пересжатию ClearScan-ных JPEG в JPEG/JPEG2000 (в случае, когда требуется сохранить размер файла, а это для эл. книги очень критично, особенно когда есть тема PDF vs. DJVU).

PS: еще я слышал, не помню где, что чистку PDF от обрезков вместо Distiller можно выполнить плагинами PitStop или Heidelberg (как бы, программный спуск полос через рамку). Или они для этого вообще не предназначены? Можно по-подробнее, название софта, где это и как делается, если можно, со ссылками. Просто хочу сравнить с Distiller, как, лучше/хуже?
 
Последнее редактирование:
PS: еще я слышал, не помню где, что чистку PDF от обрезков вместо Distiller можно выполнить плагинами PitStop или Heidelberg (как бы, программный спуск полос через рамку). Или они для этого вообще не предназначены? Можно по-подробнее, название софта, где это и как делается, если можно, со ссылками. Просто хочу сравнить с Distiller, как, лучше/хуже?
Фиксап, вроде есть специальный, так и называется - удаляет все за пределами кропбокса.
 
я и пытаюсь вычистить с помощью перегона PostScript + Distiller, но как я говорил выше, это приводит к повторному пересжатию ClearScan-ных JPEG в JPEG/JPEG2000
Так в чем проблема!
Если повторное "пересжатие" в JPEG критично, то в Distiller'e в настройках PDF поставте:

Zip.jpg


PS. Там же можно выставить "OFF" (сжатию разумеется), на размер файла, понятно, повлияет.
 
Последнее редактирование:
Если повторное "пересжатие" в JPEG критично, то в Distiller'e в настройках PDF поставте:
Я тоже так сперва думал. Однако
То есть, я правильно понимаю, что если принудительно перевести в акробате все встроенные изображения в ZIP компрессию, то Clearscan все равно при обработке перекорежит их в JPEG low-medium и помешать этому невозможно, поскольку опция отсутствует?
Совершенно верно.
:(
 
А какова цель всех этих манипуляций?
 
Топикстартер чудовищно туго выражает свои мысли, но я из всего треда понял, что он хочет, чтобы ClearScan во время своих манипуляций всегда выбирал алгоритм сжатия JPEG2000 без потерь, а это, вроде как нельзя. Правильно? 'hmmm'
 
Топикстартер чудовищно туго выражает свои мысли, но я из всего треда понял, что он хочет, чтобы ClearScan во время своих манипуляций всегда выбирал алгоритм сжатия JPEG2000 без потерь, а это, вроде как нельзя. Правильно? 'hmmm'
Да, я за то, чтобы ClearScan позволял пользователю задавать конечный формат преобразования изображений (ZIP, JPEG, JPEG2000, Combined), как на моих двух скриншотах выше, а не только JPEG2000 lossless.
А какова цель всех этих манипуляций?
Во-первых, можно будет продолжить дальнейшее редактирование инкапсулированных в PDF-изображений без потерь после процедуры ClearScan. Во-вторых, можно обрезать без потерь белые скосы после deskew и пустые области сканов Distiller'ом и уменьшить размер файлов, а заодно конвертнуть lossless FLATE/ZIP в любой формат с потерями.
 
а не только JPEG2000 lossless
Брр, я снова запутался. Вы же выше говорили, что как раз в JPEG2000 lossless он не конвертирует, а вам хотелось бы этого?
ClearScan конвертит практически все (за исключением однотонных изображений) импортированные ZIP TIFF в JPEG low-medium
Вообще я уже говорил, что ClearScan - это средство для специфического сжатия сканированого изображения (что-то типа Дежавю) и он сам по каким то своим критериям определяет как задавать алгоритм компрессии изображения. Не нравится - пользуйтесь, к примеру, фотошопом, изображение все таки растровое, там можно все что угодно с ним проделывать и в каком угодно виде сохранять.
 
@xseed, Боже мой – ЧТО вы хотите получить в конечном итоге? Не процесс, а ИТОГ!
 
@xseed, Боже мой – ЧТО вы хотите получить в конечном итоге? Не процесс, а ИТОГ!
Я хочу лишь получить на выходе ClearScan распознанный PDF с изображениями, сжатыми в ZIP, а не в JPEG. А потом делать с ними все, что угодно, хоть обрезать, хоть в JPEG пережать. Но поскольку ClearScan этого не позволяет, меня интересуют такие средства дистилляции PDF документа, которые могут корректно работать с JPEG-форматом, как это делает JPEGCrops.
Вообще я уже говорил, что ClearScan - это средство для специфического сжатия сканированого изображения (что-то типа Дежавю) и он сам по каким то своим критериям определяет как задавать алгоритм компрессии изображения.
Вот в этом-то и подвох!
Не нравится - пользуйтесь, к примеру, фотошопом, изображение все таки растровое, там можно все что угодно с ним проделывать и в каком угодно виде сохранять.
Это я делаю до ClearScan. Вы мне предлагаете отделить мух от котлет, т.е. деть куда-то распознанный слой и обрезать каждую JPEG отдельно, а их в результате процесса распознавания на странице может быть штук по 10-15. :( Т.е. меня интересует процесс редактирования изображений именно после процедуры ClearScan, а не до нее. Ведь белые скосы по краям страниц, полученные в результате Deskew ClearScan, я просто скрываю с помощью Crop Pages CropBox. А зачем в документе нужна лишняя информация, которую не видно? Ее нужно вырезать из PDF файла, чтобы она не приводила к излишнему увеличению размера PDF документа, особенно по сравнению с таким же документом в формате DJVU.
 
Последнее редактирование:
Ну снова вам повторяю: ClearScan - это, по сути, волшебная кнопка "Сделать зашибись", опции у подобной кнопки по определению не предусмотрены. Хотите чтобы было по вашему - режьте руками изображение на части, распознавайте по частям а потом руками собирайте. На автомате по любому хорошо не получается никогда.
Можно обмануть ClearScan еще по другому - искусственно увеличьте изображение в несколько раз, натравите на него ClearScan а потом с распознанным изображением уже проводите манипуляции: хотите - уменьшайте обратно, хотите в ZIP компрессию конвертируйте.
А по поводу обрезки - вы фиксап пробовали, который я советовал - получается?
 
Можно обмануть ClearScan еще по другому - искусственно увеличьте изображение в несколько раз
Попробую, тем более и сканер подходящий имеется. Думаю, более высокое разрешение (1200 dpi) позволит избавиться от артефактов JPEG. Применять буду вот так:
http://yadi.sk/d/5cRPyTJmLGzFm,
а потом обратно, downsample, меньший в 2 раза. Первые потери качества FLATE/ZIP -> JPEG делает ClearScan, вторую Distiller, третью - downsample to JPEG. Итого, качество, по сравнению с обычным распознаванием для вектора будет выше (т.к. распознавание будет идти на большем в 2 раза формате), а качество растра - хуже, т.к. будет трехпроходная компрессия в JPEG...
Упс, а насчет растра, я ошибся, я буду задавать downsample сразу в distiller. Таким образом, качество растра останется тем же, не хуже первого случая, такое же, хотя и дважды jpeg'нутое.
А по поводу обрезки - вы фиксап пробовали, который я советовал - получается?
Я просто еще не разбираюсь. Что это, специальный preflight профиль? Где его взять и как воспользоваться?
 
Последнее редактирование:
Нет. Там вроде был специальный фиксап - удалить все объекты за пределами cropbox

Таким образом, качество растра останется тем же, не хуже первого случая, такое же, хотя и дважды jpeg'нутое.
Вот именно. Хотя, конечно, пробовать надо, не факт.
 
Статус
Закрыто для дальнейших ответов.