[ID CC-CC2022] Переносы при импорте текста из PDF

korsia

Топикстартер
10 лет на форуме
Сообщения
117
Реакции
3
Здравствуйте. В общем, вопрос такой. Нужно сделать верстку в ID, используя текст с pdf (вложение). Но проблема в том что переносы из этого текста тоже остаются, хоть через буфер вставлять, хоть делать RTF текст и помещать в индиз. Есть ли какой -нибудь способ как их убрать? Может в акробате как-то можно или потом как-то в Индизе? Страниц таких много, ручками "устанешь" мягко говоря... Спасибо.
 

Вложения

  • перенос.jpg
    перенос.jpg
    278.6 КБ · Просм.: 41
Распознать и только потом копировать?
 
  • Спасибо
Реакции: George
FineReader и его православный клон ContentAI умеют распознать переносы и убить их при распознавании.
 
  • Спасибо
Реакции: Валера1966 и NNN5
Хм...
 

Вложения

pdftotext.exe "filein" "fileout"

само собой, никаких стилей не сохраняется

"кончик синего интродьюсера и доставочный катетер, посредством эхо-контроля необходимо убедиться, что кончик доставочного катетера все еще находится в просвете вены. Это особенно актуально у пациентов с выраженной подкожной жировой клетчаткой с глубоким расположением сафенной вены. Если эхо-картина сомнений не вызывает, то выполняется последнее введение клея в вену и катетер резким движением извлекается, а место доступа сдавливается марлевой салфеткой до достижения гемостаза. В соответствии с модифицированным протоколом, после того как в месте доступа появляется метка 5 см на синем интродьюсере, производится последнее введение клея в вену и катетер вытягивается на 3 см и проводится мануальная компрессия. По истечении 30 с из интродьюсера отсоединяется и извлекается..."
 
  • Спасибо
Реакции: korsia
Рома прав. Переносы исчезают, как волны за кормой. Простые движенья рук
1758288199159.png
 
Последнее редактирование:
Да там и не нужен никакой другой путь, прекрасно все экспортируется из Acrobat в текст без переносов
 
Ну или в ИнДизайне найти все "точка пробел абзац" и "точка абзац" и заменить их на ***.
Потом найти и удалить все абзацы.
И потом заменить *** на "точка пробел абзац"
 
Ну или в ИнДизайне найти все "точка пробел абзац" и "точка абзац" и заменить их на ***.
Потом найти и удалить все абзацы.
И потом заменить *** на "точка пробел абзац"
Сохранить из акробата в doc, убрать все мягкие переносы (если мешают) и копипастнуть в ID? :)