Объем файла интерактивного pdf

Статус
Закрыто для дальнейших ответов.

Linxy

Девушка с битой
Топикстартер
10 лет на форуме
Сообщения
2 277
Реакции
3 836
Доброе утро!
Вопросов по данной теме уже нет, хочу просто поделиться опытом.
Возможно, для кого-то мои «находки» покажутся элементарными, но мне для решения проблемы потребовалось немало времени. Надеюсь мой опыт поможет кому-то другому сэкономить время.
Суть задачи: есть интерактивный документ (справка), 184 стр., с ног до головы напичканный разными кнопками и ссылками, 404 иллюстрации.
Процесс:
1. При прямом экспорте pdf из Indesign получаем файл размером 44,1 Мб. Настройки экспорта в приложенном файле.
2. Делаем pdf файлу Save As с другим именем и получаем уменьшение на 2,3 Мб. Результат — pdf файл 41,8 Мб. Все еще слишком много.
3. Оцениваем использование пространства с помощью Audit Space Usage и получаем следующую картину:
AuditSpaceUsageBefore.jpg
После этого были долгие поиски в сети: выяснения, что за зверь этот «Заголовок документа» (Document Overhead), за счет чего его можно уменьшить. Потом куча экспериментов: распространённый на англоязычных форумах и здесь совет поставить в оптимизаторе Discard private data of other applications результата не дал; поочередно выставлялись все настройки оптимизации, но опять же никаких толковых результатов. Уменьшение размера удалось достигнуть только убив всю интерактивность — это не то, что нужно.
4. Путем долгих проб и ошибок все наконец-то получилось: с помощью функции Проверить документ (Examine Document) в Acrobat`e анализируем файл и получаем:
Examine Document.jpg
5. Ставим галку в пункте Метаданные и удаляем их. Сохраняемся.
6. Результат — pdf файл размером 12,9 Мб.
7. Опять делаем Audit Space Usage, чтобы посмотреть как поживает пункт Заголовок документа:
AuditSpaceUsageAfter.jpg
Все счастливы.
 

Вложения

  • PDF Summary.rar
    1.3 КБ · Просм.: 641

1998

Участник
Сообщения
1 895
Реакции
1 321
Ответ: Объем файла интерактивного pdf


Не по теме:
«Заголовок документа»
«Хартия переводчиков, товарищ Лифанов, гласит, что перевод в современном мире должен способствовать лучшему взаимопониманию между народами, а Вы своим лепетом будете их только разобщать»

 

Linxy

Девушка с битой
Топикстартер
10 лет на форуме
Сообщения
2 277
Реакции
3 836
Ответ: Объем файла интерактивного pdf


Не по теме:
1998, меня это тоже заставило улыбнуться. Функцией Audit Space Usage пользовалась впервые и сначала подумала, что под «Заголовком документа» имеется в виду что-то типа основной информации файла, сжатие которой приведет к потери данных. Товарищи из Adobe вводят в заблуждении, однако.

Удаленные метаданные, как выяснилось, отлично архивировались:
  • pdf (с метаданными) размером 41,8 Мб сжимался в архив размером 6,67 Мб.
  • pdf (без метаданных) размером 12,9 Мб — в архив размером 6,31 Мб при аналогичных параметрах сжатия.
 

1998

Участник
Сообщения
1 895
Реакции
1 321
Ответ: Объем файла интерактивного pdf

Верно, XMP предназначены для извлечения (в том числе) софтом, не понимающим формат pdf -- т.е. хранятся как ascii xml. В т.ч. аскифицируются (читай -- разбухают в размерах) чисто бинарные данные, типа thumbnail'ов, или что там было напихано в "метаданных" этих имиджей. А в сухом остатке (т.е. в архиве), как показал Фил Кац :), количество данных почти не изменяется.


Не по теме:
заставило улыбнуться
Здоровый пофигизм :)
Кстати, в данном случае, перевод по сути, а не формально -- "Остальное". Все, что они поленились вынести отдельными пунктами, но что необходимо чтобы "добить" до 100%, вынесено в overhead. Реально к overhead относится не так много вещей, начиная с 4х байт "%PDF" в заголовке файла и т.п.:). Метаданные, так же как более неиспользуемые, оставшиеся от предыдущих ревизий файла (до Save as) объекты, не могут быть отнесены к overhead по формальному смыслу слова. Имхо :)



P.s. Проверьте также галку "обрезанное содержимое". Поможет сэкономить немного байт, если "обрезаны" (т.е. частично скрыты маской) растровые изображения.
 

Linxy

Девушка с битой
Топикстартер
10 лет на форуме
Сообщения
2 277
Реакции
3 836
Ответ: Объем файла интерактивного pdf

1998, спасибо за доступное разъяснение технической стороны вопроса.
Проверьте также галку "обрезанное содержимое"
В моем случае вообще ничего не меняет. Размер pdf остается точно такой же.

Dorg, Вы абсолютно правы. Эта галочка дает практически такие же результаты.

Не по теме:
Сейчас не могу сказать, почему я пришла к удалению метаданных именно со стороны проверки документа, т.к. все экспериментальные pdf уже удалены. Возможно, с этой галкой оптимизатор завис (с ним такое пару раз случалось) и я ее не проверила нормально, возможно, я поставила ее с еще какой-то вместе и это дало
Уменьшение размера удалось достигнуть только убив всю интерактивность — это не то, что нужно.
В любом случае это тоже вариант.

 

gasyoun

Санскритятина
15 лет на форуме
Сообщения
926
Реакции
30
Проверить документ (Examine Document)
Осталось найти этого зверя. Хотя это беда интерактивных документов, а не книг сканированных, где размер пухнет, увы, из-за картинок, то есть jpeg.
 

Linxy

Девушка с битой
Топикстартер
10 лет на форуме
Сообщения
2 277
Реакции
3 836
Осталось найти этого зверя.
В Acrobat 9 это сидит в меню Документ, в Acrobat X — Tools (Инструменты) > Protection (Защита) > Remove Hidden Information (Удалить скрытую информацию).
Кстати, в разделе Tools (Инструменты) > Document Processing (Обработка документа) находила как-то функцию Optimize Scanned PDF (Оптимизировать отсканированный документ). Сама не пробовала, пока было не нужно, но может Вам пригодится.
 
Статус
Закрыто для дальнейших ответов.