Удалить/оставит в PDF страницы, содержащие только текст.

Статус
Закрыто для дальнейших ответов.

ch_alex

Погулять вышел.
Топикстартер
15 лет на форуме
Сообщения
8 420
Реакции
2 709
Сабж. В дополнение скажу, что следует оставить или удалить смешанные страницы, т.е. содержащие не обязательно текст, но обязательно содержащие фотографии. Предполагается, что макет прост, как угол дома, и не содержит сплющенных прозрачностей.

Попробовал сделать это Питстопом, но не обнаружил ни флага активности любого выбора, ни условного оператора IF.

Дело в том, что сдали 200-страничный макет, в котором выборочно лежат страницы с фотографиями. Текст заказчик вывел на лазернике, но страницы с фотографиями хочет вывести на ФНА. Просматривать и ручками удалять не хочется (но пришлось).

Существует ли принципиальная возможность сделать такую "чистку" Питстопом? ОП не предлагать - я традиционно слаб в объектном программировании.
 

Specialist

15 лет на форуме
Сообщения
2 035
Реакции
8
Ответ: Удалить/оставит в PDF страницы, содержащие только текст.

Вопрос ИМХО легче было порешать на этапе вывода PS. Даже для Ворда проще было бы написать скрипт, чем ловить что-то в PDF... Хотя...

Есть одна мысля. Довольно неординарная. Может быть, даже граничащая с безумием. :)

Разобрать PDF на страницы средствами Акробата, отсортировать в файл-менеджере по размеру и взять только самые большие. Границу большая/маленькая определить экспериментально. Потом собрать обратно в многостраничный PDF и гнать его на вывод. Как вам?

Метод, сами понимаете, не стопроцентно надежный, но для макета простого как угол дома должно прокатить...
 

I-O p a

Участник
Сообщения
311
Реакции
48
Ответ: Удалить/оставит в PDF страницы, содержащие только текст.

Можно сделать полуавтоматически: Preflight->List all images-> ну и дальше руками.
 

ch_alex

Погулять вышел.
Топикстартер
15 лет на форуме
Сообщения
8 420
Реакции
2 709
Ответ: Удалить/оставит в PDF страницы, содержащие только текст.

Specialist сказал(а):
Есть одна мысля. Довольно неординарная. Может быть, даже граничащая с безумием. :)
Да, она также была предложена нашим директором. Хотя не факт, что удастся гарантированно отсеять "пустышки" - были фотографии размером в фото в паспорте и с крайне низким разрешением. ;)

ну и дальше руками.
Увы, не годится.

Проблема в том, что файлы поступают извне. Т.е. типография решила сэкономить на выводе, только "их дизайнер как раз в отпуске".


Не по теме:
При таких раскладах я склонен подобные работы учитывать по времени или просто по минимальной таксе, если уложились в 5 минут. Минимальная такса - 5 у.е. ;) То же самое касается массовых переименований линкованных файлов с кириллицы в латиницу и перелинковка в Кварке или где ещё. Я уже устал убеждать устно. Видимо, метод убеждения сильнее подействует, если перенести его в финансовую область.

P.S. Заметили все наши - если с заказчиком вась-вась, то он и с платежами затягивает, а то и вообще пытается оставить задолженность. Если же берёшь железной рукой суда за яй... э... короче, заставляешь выплачивать долги по суду, то зарабатываешь уважение. Что греет мне душу - я активно уговаривал начать показательный процесс против самого большого нашего должника. Процесс начался и был выигран. Позже была возможность достигнуть компромисса - растянуть выплаты. Теперь директорат и бухгалтерия этой фирмы сами звонят и с тревогой спрашивают - почему мы задерживаем выставление счетов на оплату? :D

 

suntory

Administrator
15 лет на форуме
Сообщения
23 688
Реакции
12 617
Ответ: Удалить/оставит в PDF страницы, содержащие только текст.

Можно попробовать AutoSplit™ plug-in
Automatically find and extract pages that contain specific PDF elements such as forms, images, links, comments, notes, rubber stamps, highlighting, JavaScript code, transparency effects, page rotation and many others. 18 different options are available.
http://evermap.com/autosplit.asp#Split by Content
 

suntory

Administrator
15 лет на форуме
Сообщения
23 688
Реакции
12 617
Ответ: Удалить/оставит в PDF страницы, содержащие только текст.

Попробовал - работает
 

Intruder

Я вижу молекулы
R.I.P.
Сообщения
477
Реакции
167
Ответ: Удалить/оставит в PDF страницы, содержащие только текст.

По-моему, вы занимаетесь ерундой.
Отсмотреть 200 страниц, нажимая Ctrl+Shift+D на ненужных страницах, полчаса времени.
Не стоит приумножать сущностей, сверх необходимого © Оккам
 

Specialist

15 лет на форуме
Сообщения
2 035
Реакции
8
Ответ: Удалить/оставит в PDF страницы, содержащие только текст.

А по-моему это дико скучно и непродуктивно.
 

ch_alex

Погулять вышел.
Топикстартер
15 лет на форуме
Сообщения
8 420
Реакции
2 709
Ответ: Удалить/оставит в PDF страницы, содержащие только текст.

Intruder сказал(а):
Отсмотреть 200 страниц, нажимая Ctrl+Shift+D на ненужных страницах, полчаса времени.

Не по теме:
Ну... Счастливые часов не наблюдают. В отдельные периоды времени у меня на выводе за 5 минут скапливаются 3-4 срочные работы. Слава богу препресс им не нужен, но пол-часа на одну работу - многовато. Особенно если это не полноцветный журнал, а ч/б публикация.
 

Skvoznyak

15 лет на форуме
Сообщения
5 500
Реакции
2 168
Ответ: Удалить/оставит в PDF страницы, содержащие только текст.

надо все же покопать скриптинг для Акробата.. попробую на досуге.
 

Specialist

15 лет на форуме
Сообщения
2 035
Реакции
8
Ответ: Удалить/оставит в PDF страницы, содержащие только текст.

Да, и у меня была такая мысля...
 

Skvoznyak

15 лет на форуме
Сообщения
5 500
Реакции
2 168
Ответ: Удалить/оставит в PDF страницы, содержащие только текст.

попробовал на C#. пока не очень понятно как это сделать.

кто-нибудь в курсе, что такое Acrobat Access 3.0 Type Library (accessibility.api), и можно ли через нее как-то работать с документом? PDDom там обнадеживающий, но как его привязать к активному документу - не понимаю.

в acrobat.tlb не обнаружил никаких методов, с помощью которых можно разобрать содержимое страницы. плагин, что ли надо ваять для такой мелочи...
 
Статус
Закрыто для дальнейших ответов.