Помогите новичку. Не могу скопировать текст из PDF

Статус
Закрыто для дальнейших ответов.

akobelkov

Участник
Топикстартер
Сообщения
15
Реакции
0
Добрый день!

До этого пользовался только Acrobat Reader, никогда тексты не верстал.

Проблема.
Есть pdf файл с описанием продукции. На одной странице текст (русский язык) описания можно копировать, на остальных нет. Скачал Adobe Acrobat 7.0 Prof думал что он разберет страницу на элементы и позволит скопировать текст, но в нем тоже нельзя скопировать. Защиты на документе нет (посмотрел в акробате). Пробовал конверторы из PDF в Word, один тупо страницы преобразовал в картинки, второй тоже ничего хорошего не сделал.

Вопрос. Как скопировать текст? Ведь не картинками же его делали :)
 

garif

R.I.P.
Сообщения
8 112
Реакции
3 109
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Оптимальный вариант - распознать через FineReader или ему подобные.
А вообще, файл неплохо было бы посмотреть.
 

DmitS

В бане
Сообщения
438
Реакции
506
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Во-первых, убедитесь, что ваш файл содержит шрифты, а не кривые и не растр: Ctrl+D\Fonts.

Если текст в шрифтах:
В Acrobat'e есть инструмент Select Text: выделяете\Copy\Paste.
Если нужно извлечь весь текст, тогда экспорт в RTF.

Если нет:
В меню Document есть команда OCR Text... (правда не уверен, что 7.0 распознает кириллицу).
 

akobelkov

Участник
Топикстартер
Сообщения
15
Реакции
0
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Во-первых, убедитесь, что ваш файл содержит шрифты, а не кривые и не растр: Ctrl+D\Fonts.

Если текст в шрифтах:
В Acrobat'e есть инструмент Select Text: выделяете\Copy\Paste.
Если нужно извлечь весь текст, тогда экспорт в RTF.

Если нет:
В меню Document есть команда OCR Text... (правда не уверен, что 7.0 распознает кириллицу).

Да, практически все это делал. Повторюсь, на одной странице можно использовать Select Text, на остальных нет.
Как в OCR подключить русский язык?

Файл не могу вложить в сообщение, большой. Сейчас разберусь с местным файлообменником.
 

Вложения

  • Swati_1.png
    Swati_1.png
    6.9 КБ · Просм.: 1 821

akobelkov

Участник
Топикстартер
Сообщения
15
Реакции
0
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Оптимальный вариант - распознать через FineReader или ему подобные.
А вообще, файл неплохо было бы посмотреть.

Залил файл (ссылку не разрешает добавить на него, называется Каталог.Страница 6)

Скажите, а картинки всегда надо собирать? :)


Этот диалог я видел, но там у меня нет русского языка :( Видимо надо дополнение какое-то ставить.
 

akobelkov

Участник
Топикстартер
Сообщения
15
Реакции
0
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Вот ссылка на файл - http://forum.rudtp.ru/downloads.php?do=file&id=407

На этой странице текст в кривых.


Подскажите пжл как мне следует поступить чтобы появилась возможность его скопировать? Исходники уже запросил у автора, но ждать не хочется.
 

George

I wish I was a monster you think I am
15 лет на форуме
Сообщения
17 302
Реакции
7 865
Ответ: Помогите новичку. Не могу скопировать текст из PDF

1. Распознать средствами Акробата Про и сохранить как rtf - с него уже вытянуть текст.
2. Распознать средствами Акробата Про открыть, в Serif PagePlus - в самом pdf сделать коррекцию по быстрому.
 

suntory

Administrator
15 лет на форуме
Сообщения
23 353
Реакции
12 403
Ответ: Помогите новичку. Не могу скопировать текст из PDF

В 7-м Акробате русского OCR вроде не было.

Вот, распознал Finereader, сначала пришлось в Illustrator убрать лишнее и увеличить. Сверху и сбоку пару слов наберете самостоятельно.

Посмотреть вложение SWATI_catalogue 6_.rar.
 

akobelkov

Участник
Топикстартер
Сообщения
15
Реакции
0
Ответ: Помогите новичку. Не могу скопировать текст из PDF

В 7-м Акробате русского OCR вроде не было.

Вот, распознал Finereader, сначала пришлось в Illustrator убрать лишнее и увеличить. Сверху и сбоку пару слов наберете самостоятельно.

Посмотреть вложение 50723.

Блин, не думал что так сложно будет :) Придется FineReader ставить. На всяк. случай каким распознавали, версия?
 

George

I wish I was a monster you think I am
15 лет на форуме
Сообщения
17 302
Реакции
7 865
Ответ: Помогите новичку. Не могу скопировать текст из PDF

В 7-м Акробате русского OCR вроде не было.
Это да. Только с 9-го появился. Первый пост невнимательно прочитал.
 

suntory

Administrator
15 лет на форуме
Сообщения
23 353
Реакции
12 403
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Версия Finereader 10, pdf делал такой:
http://forum.rudtp.ru/downloads.php?do=file&id=408

Acrobat 10 мой pdf тоже нормально распознает. А 7-й Acrobat просто отказался распознавать, даже если бы в нем был русский словарь, толку было бы мало.
 

akobelkov

Участник
Топикстартер
Сообщения
15
Реакции
0
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Версия Finereader 10, pdf делал такой:
http://forum.rudtp.ru/downloads.php?do=file&id=408

Acrobat 10 мой pdf тоже нормально распознает. А 7-й Acrobat просто отказался распознавать, даже если бы в нем был русский словарь, толку было бы мало.

Красивый файл, ка к вы картинки убрали?
Запутался немного. У меня два pdf-каталога.
Как их преобразовать для распознования FR? Попробовал ABBYY FineReader 6.0 Sprint но он не хочет pdf кушать.
Подскажите правильную последовательность дествий, пжл.
 

suntory

Administrator
15 лет на форуме
Сообщения
23 353
Реакции
12 403
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Вообще достаточно просто увеличить раз в 4-5.

ABBYY FineReader 6.0 Sprint но он не хочет pdf кушать
Он не умеет, научился по-моему с 8-й версии, и не Sprint.

Можно сохранить из Акробата в jpeg/tiff с высоким разрешением и распознавать вашим Sprint. Должно получится.

Красивый файл, ка к вы картинки убрали?
Я написал:
сначала пришлось в Illustrator убрать лишнее и увеличить
Но это лишняя и не очень нужная работа, у вас вроде много страниц.
 

akobelkov

Участник
Топикстартер
Сообщения
15
Реакции
0
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Появилась потребность переделать слегка буклет, т.е. заменить название в нижнем колонтитуле на свое ну и первые страницы переписать. В каком ПО это лучше сделать? И еще зачем делают текст в виде картинок, чтобы нельзя было скопировать?
 

garif

R.I.P.
Сообщения
8 112
Реакции
3 109
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Буклет в pdf? Сколько страниц? Нк видя конкретного макета, довольно сложно сказать.
Если наугад: Serif, InDesign, Illustrator - выбирайте что больше нравится.
 

akobelkov

Участник
Топикстартер
Сообщения
15
Реакции
0
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Буклет в pdf? Сколько страниц? Нк видя конкретного макета, довольно сложно сказать.
Если наугад: Serif, InDesign, Illustrator - выбирайте что больше нравится.
Ну это я его так назвал, может неправильно. Мне нужна возможность редактировать PDF файл, убирать картинки из него и всталвять свои. Добавить свой текст. Попробую Illustrator. Пример старницы все еще лежит в файлообменнике - Каталог.Страница 6
 

DmitS

В бане
Сообщения
438
Реакции
506
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Ваш исходный файл был создан в INDD, но в нем вы редактировать PDF не сможете. Если и вы владеете Ai, то лучше в нем постранично и работать.
 

akobelkov

Участник
Топикстартер
Сообщения
15
Реакции
0
Ответ: Помогите новичку. Не могу скопировать текст из PDF

Ваш исходный файл был создан в INDD, но в нем вы редактировать PDF не сможете. Если и вы владеете Ai, то лучше в нем постранично и работать.
Я Ai первый раз в глаза вижу и как уже писал только Adobe Reader использовал, тема дизайна и верстки оочень далека от меня, но как говориться нужда заставила :) Подредактировал слегка страницы в Ai, НО появился вопрос. Совсем не понимаю под какой формат сделан каталог. Я попробовал распечатать, совсем маленький получается размер на А4. Подскажите возможно ли из этого размера Ai показывает W 255,118 pt H 340,157 pt сделать по-больше без потери качества и каким средством?

Спасибо за терпение к моим вопросам!!!
 
Статус
Закрыто для дальнейших ответов.