[Acr DC] PDF Текст и картинки-иконки в тексте перевести в .docx

tofan

Топикстартер
12 лет на форуме
Сообщения
254
Реакции
37
Кто может посоветовать, как этот винегрет текста и картинок лучше и быстрее всего распознать? чтобы и текст остался нормальным (предложением), а не кучей текстовых рамочек, и картинки чтобы в тексте были.
 

Вложения

  • Рисунок1.png
    Рисунок1.png
    173.8 КБ · Просм.: 69

_MBK_

Пикирующий бомбардировщик
12 лет на форуме
Сообщения
29 921
Реакции
9 835
А какой оригинал? Если растр , замазать картинки белым, распознать, а потом вставить
 
  • Спасибо
Реакции: tofan

tofan

Топикстартер
12 лет на форуме
Сообщения
254
Реакции
37
оригинал - хороший PDF, но картинок много, каждую замазывать. придется таки в два захода распознавать, сначала текст, ничего не замазывая, на месте картинок получатся, конечно, всякие кракозябры, потом обвести каждую картинку, и опять распознать, и вставлять по одной в текст, в общем, кошмар намечается
 

izrukvruki

12 лет на форуме
Сообщения
1 308
Реакции
179
Кто может посоветовать, как этот винегрет текста и картинок лучше и быстрее всего распознать? чтобы и текст остался нормальным (предложением), а не кучей текстовых рамочек, и картинки чтобы в тексте были.
Это скорее всего переводческое агентство... Дают PDF с одним языком (в данном случае русский), куча картинок-иконок по тексту + текст другого языка (например английский). Нужно заменить русский текст на английский.

Я бы из pdf вытащил картинки и все заново сверстал, а не мучался с заменой в pdf текста
 
  • Спасибо
Реакции: tofan

_MBK_

Пикирующий бомбардировщик
12 лет на форуме
Сообщения
29 921
Реакции
9 835

Не по теме:
Вот характерный пример того, когда кроилово одних приводит к попадалову других ;)
 
  • Спасибо
Реакции: tofan

lexter77

Участник
Сообщения
122
Реакции
57
и вставлять по одной в текст, в общем, кошмар намечается
Действительно проще и быстрее заново сверстать. Например, в индизайне: разных иконок там не так много, один раз иконку вставить, настроить anchored object и копипастить потом по месту.
 
  • Спасибо
Реакции: tofan

tofan

Топикстартер
12 лет на форуме
Сообщения
254
Реакции
37
вы почти угадали с переводом, мне нужно подготовить этот документ для последующего перевода, pdf переделываю в ворд, нужен текст и картинки в нем, потом он идет на перевод
 

izrukvruki

12 лет на форуме
Сообщения
1 308
Реакции
179
вы почти угадали с переводом, мне нужно подготовить этот документ для последующего перевода, pdf переделываю в ворд, нужен текст и картинки в нем, потом он идет на перевод
Мне показалось, что оплата за эту работу, не покроет мои затраты на электроэнергию
 
  • Спасибо
Реакции: tofan

_MBK_

Пикирующий бомбардировщик
12 лет на форуме
Сообщения
29 921
Реакции
9 835
А в каком виде PDF - растр или вектор?
 
  • Спасибо
Реакции: tofan

_MBK_

Пикирующий бомбардировщик
12 лет на форуме
Сообщения
29 921
Реакции
9 835
В таком случае, не пойму, зачем тут вообще OCR?
 
  • Спасибо
Реакции: tofan

tofan

Топикстартер
12 лет на форуме
Сообщения
254
Реакции
37
текст должен быть в ворде. из pdf его, конечно, можно вытащить, просто вот так копируя, но картинки при этом не копируются, приходится тащить их в OCR, ну а как иначе?
 

Вложения

  • Рисунок2.png
    Рисунок2.png
    202.6 КБ · Просм.: 32

George

I wish I was a monster you think I am
12 лет на форуме
Сообщения
15 787
Реакции
7 333
А что если из самого акробата сохранить как вордовский документ? Разве не получается?
 
  • Спасибо
Реакции: tofan

George

I wish I was a monster you think I am
12 лет на форуме
Сообщения
15 787
Реакции
7 333
Образец странички PDF надо прикладывать, либо шабаш ведьм и колдунов предсказывать отказывается.
 
  • Спасибо
Реакции: tofan

_MBK_

Пикирующий бомбардировщик
12 лет на форуме
Сообщения
29 921
Реакции
9 835
На тот случай, если по каким то религиозным соображением вам некошерно пользоваться акробатовским конвертером
 
  • Спасибо
Реакции: tofan

_MBK_

Пикирующий бомбардировщик
12 лет на форуме
Сообщения
29 921
Реакции
9 835
  • Спасибо
Реакции: tofan

tofan

Топикстартер
12 лет на форуме
Сообщения
254
Реакции
37
прикрепила две странички pdf. Если делать экспорт из актобата в ворд, такой бардак получается, текст бьется на куски в текстовых рамках, сами картинки не берутся, потому что они под текстом, не, лучше уж в OCR, а открывать pdf прямо из ворда и не пробовала даже, надо попробовать, но что-то мне так кажется, что будет аналогичный бардак, когда на экспорт из акробата. пока некогда экспериментировать, надо доделать
 

Вложения

  • на пробу.pdf
    94.8 КБ · Просм.: 25

Gad

Участник
Сообщения
1 970
Реакции
873
Можно разделить префлайтом картинки и текст в разные слои документа (по желанию можно разделить на 2 pdf, в одном картинки на своих местах, в другом текст также префлайтами). Без переверстки думаю сделать не получится. Но замазывать уж точно ничего не нужно :)
 
  • Спасибо
Реакции: tofan

_MBK_

Пикирующий бомбардировщик
12 лет на форуме
Сообщения
29 921
Реакции
9 835
  • Спасибо
Реакции: tofan