[Acr X] Печать текста из PDF/a

Asvad

Топикстартер
10 лет на форуме
Сообщения
89
Реакции
9
Мира вам.
Принесли файл PDF/a - 420 страниц, подходит под формат А5. С черными тенями в местах сгиба на корешке.
При выделении текста - копируется и ставится: чист и без ошибок.
Хотят 2-3 экземпляра книги. По сему и переверстка - нерентабельна.
Так вот, а нельзя ли вывести на печать из PDF/a только текстовый слой, игнорировав растровый?
 

zollinger

Участник
Сообщения
553
Реакции
168
Образец в студию. Несколько страниц из файла
 

suntory

Administrator
15 лет на форуме
Сообщения
23 438
Реакции
12 479
По описанию похоже на скан с невидимым OCR текстом.
 

zollinger

Участник
Сообщения
553
Реакции
168
По описанию похоже на скан с невидимым OCR текстом.
да так оно и есть, скорее всего. Но мы должны быть уверены же :) плюс где там у него эти тени. может, их просто обрезать можно и не париться
 

George

I wish I was a monster you think I am
15 лет на форуме
Сообщения
17 324
Реакции
7 870
OCR не может быть на 100% "прав". Осторожней со своими идеями. Проще загнать в индизайн это дело и "отрезать тени", вывести PDF этот растровый. Если устраивает заказчика изменение качества - пусть так и будет.

Либо это время и деньги за прогон по OCR и перечитку, да перевёрстку.
 
  • Огонь
Реакции: Flame

George

I wish I was a monster you think I am
15 лет на форуме
Сообщения
17 324
Реакции
7 870
Просто возникла идея :)
Trash Throw Away GIF by Jomboy Media
 

Drawer

Участник
Сообщения
1 816
Реакции
799
нельзя ли вывести на печать из PDF/a только текстовый слой, игнорировав растровый?
Нет :) Там нет текстового контента кроме невидимого OCR :) Чистить/обрезать, частично ручками. Распознание/переверстка будет натуральный АД...
 

Jimmi

Участник
Сообщения
54
Реакции
7
Да на последней странице уже видно расхождение в тексте - просто убрать фон и видно что останется в итоге.
 

George

I wish I was a monster you think I am
15 лет на форуме
Сообщения
17 324
Реакции
7 870
Распознание/переверстка будет натуральный АД...
Если это автор и он не договорился с пред. верстальщиком о передаче пэкэджа, но хочет вносить вправки, — придётся. И надо будет платить. И теперь уже точно доплатить за передачу "исходника".

1711451961645.png
 

Asvad

Топикстартер
10 лет на форуме
Сообщения
89
Реакции
9
не договорился с пред. верстальщиком о передаче пэкэджа
Книга 2010 года. Искать пакет нереально.
Просто пытливый ум не дает покоя: если есть растр, а под (или над?) ним есть символ, его знакоместо определено - то почему бы не распечатать символ?
 

George

I wish I was a monster you think I am
15 лет на форуме
Сообщения
17 324
Реакции
7 870
В Акробате оно подразумевается для того, чтобы этот текст сохранить куда в текстовый формат файла. Может и есть какие-то методы выключения растра и показа только текста ocr в пдф, не находил (и плюнул на поиск, когда увидел, что ошибки распознавания есть, их не может не быть).
 
Последнее редактирование:

Drawer

Участник
Сообщения
1 816
Реакции
799
Разнес по слоям и вытащил на передний план Ваш текст. Не уверен что Вас это устроит :)
Сделайте слой Image невидимым и посмотрите что получится :)
 

Вложения

  • govor_1_.pdf
    200.7 КБ · Просм.: 27
  • Спасибо
Реакции: ~RA~

George

I wish I was a monster you think I am
15 лет на форуме
Сообщения
17 324
Реакции
7 870

Drawer

Участник
Сообщения
1 816
Реакции
799
рассказывай как.
фиксапом разнес по слоям, потом все изображения питстопом на задний план перенес и покрасил текст (питстопом). Как-то пытался решить такое через cpdf, но он не красит OCR текст бесцветный текст.
 
Последнее редактирование:

zollinger

Участник
Сообщения
553
Реакции
168
1711454741181.png
 

Asvad

Топикстартер
10 лет на форуме
Сообщения
89
Реакции
9
Не уверен что Вас это устроит :)
Действительно, я не учел про Bold...

Спасибо всем, что отвадили меня от этой идеи.
Продолжаю резать излишние поля и оставляю только поле верстки. Почти половину книги сделал.
 

zollinger

Участник
Сообщения
553
Реакции
168
Да разнести по слоям несложно вроде
1711454980236.png
 
Последнее редактирование: