[Acr DC] Знаки и символы вместо текста

ivan0899

Участник
Топикстартер
Сообщения
11
Реакции
0
Здравствуйте, уважаемые форумчане!

Ситуация следующая. Есть документ pdf, в котором не работает поиск по тексту. Посмотрел встроенные шрифты - пусто (см. img005). По виду это Times New Roman. При обычном копировании (из Acr DC) текст представляет из себя бессвязный набор символов - стрелки, цифры, значки и т.п. При копировании "с форматированием" текст становится текстом (см. img004). Это сам файл стр31, выложенный на файлообменник. Всю книгу выложить не могу, так как правилами вузовской библиотеки это делать запрещено. Мне разрешили скопировать на носитель только одну страницу, чтобы показать специалистам. Такие электронные книги не часто, но попадаются, но никто не знает, в чем дело именно в этом случае. На мой взгляд - не встроены шрифты, раз их нет в разделе "шрифты". Но тогда непонятно, как программа копирует текст и вставляет их в Word или Блокнот в читаемом виде. Да, ситуация не самая безнадежная, но когда время поджимает, без поиска сложно быстро ориентироваться по тексту. Я не сотрудник библиотеки, студент-заочник, спрашивал их, обращались ли к поставщику (вуз и библиотека платят деньги за электронные книги), они сказали что обращались, но внятного ответа не получили, а так как таких книг некритическое количество в общей массе, то настаивать не стали. Есть ли решение этой ситуации? И можно ли что-то делать с такими книгами, не нарушая законодательство об авторских правах, я имею в виду использование гипотетического способа исправления документа, когда начинает работать поиск по тексту.
 

Вложения

  • Image 004.png
    Image 004.png
    631.1 КБ · Просм.: 754
  • Image 005.png
    Image 005.png
    132.5 КБ · Просм.: 723

german

20 лет на форуме
Сообщения
4 566
Реакции
649
Это сам файл стр31, выложенный на файлообменник.
На мой взгляд - не встроены шрифты, раз их нет в разделе "шрифты". Но тогда непонятно, как программа копирует текст и вставляет их в Word или Блокнот в читаемом виде.
У Вас шрифты встроены не полностью, а только используемые символы (Embedded subset). Если Вы хотите, чтобы шрифты были полностью встроены, выключайте при создании pdf любую возможность замены шрифтов.
 

Вложения

  • subset fonts 1.png
    subset fonts 1.png
    52.8 КБ · Просм.: 596
  • subset fonts.png
    subset fonts.png
    69.9 КБ · Просм.: 652

ivan0899

Участник
Топикстартер
Сообщения
11
Реакции
0
У Вас шрифты встроены не полностью, а только используемые символы (Embedded subset). Если Вы хотите, чтобы шрифты были полностью встроены, выключайте при создании pdf любую возможность замены шрифтов.

Попробовал сохранить эту страницу через Печать (принтер Adobe PDF) по указанным вами настройкам (снятая галочка), но Поиск не заработал, остальное немного изменилось (при выделении текста в pdf междустрочный интервал стал как-будто больше.

Прочитал "Инструкцию по ошибкам обязательного экземпляра" из темы Обязательный электронный экземпляр и преобразование PDF в PDF/A для РГБ. Получается, что это могут исправить только в издательстве, т.к. у них имеется макет книги, при сохранении которого в формат pdf не встроили шрифты?

Всю тему я читать не стал, т.к. там более полутысячи постов, в основном описание действий методом проб и ошибок по предлагаемым советам, причем многое, о чем там идет речь, мне непонятно. Наткнулся только на Инструкцию по ошибкам.

pdf-recode превращает текст в черные ромбы со знаком вопроса внутри.
 

ivan0899

Участник
Топикстартер
Сообщения
11
Реакции
0
Спасибо, я нашел там Инструкцию, которая мне кое-что пояснила. Остальные 500+ постов сильно портят настроение и ломают мне мою мыслительную коробку.
 

ivan0899

Участник
Топикстартер
Сообщения
11
Реакции
0
В общем, ничего не помогло. Шрифты не встраиваются.
 
Последнее редактирование:

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 228
Реакции
10 851
Получается, что это могут исправить только в издательстве, т.к. у них имеется макет книги, при сохранении которого в формат pdf не встроили шрифты?
Если у вас уже в PDF встроен огрызок шрифта, то Кэп опасается, что фарш вы назад не провернете без исходного макета
Так же, как если бы текст был в кривых
Или файнридером, но это сурово. Вы зря читать ленитесь, все придумано до вас
 

german

20 лет на форуме
Сообщения
4 566
Реакции
649
Попробовал сохранить эту страницу через Печать (принтер Adobe PDF) по указанным вами настройкам (снятая галочка), но Поиск не заработал, остальное немного изменилось (при выделении текста в pdf междустрочный интервал стал как-будто больше.
Надо изначально делать пдф с такими настройками. Я другого метода не знаю.
 

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 228
Реакции
10 851
Надо изначально делать пдф с такими настройками. Я другого метода не знаю.
Так он уже кастрированный PDF восстановить пытается. Это напоминает мне эпизод моего далекого счастливого детства, когда один мой друг, потеряв правый тапок и найдя похожий левый отмачивал его в реке, чтобы он цвет поменял и ориентацию. С цветом вроде бы получилось, а дальше беда
 

german

20 лет на форуме
Сообщения
4 566
Реакции
649

ComboGP

Участник
Сообщения
14
Реакции
11
Рабочий вариант, проще, без Акробатовского PS:
_31.pdf -> GSView 6.0 (Ghostscript 9.19) -> PDF v1.3 -> pdf-recode_2008.11.01
 
Последнее редактирование:

ivan0899

Участник
Топикстартер
Сообщения
11
Реакции
0
Рабочий вариант, проще, без Акробатовского PS:
_31.pdf -> GSView 6.0 (Ghostscript 9.19) -> PDF v1.3 -> pdf-recode_2008.11.01
Здравствуйте!
Вчера делали по указанному способу. Все хорошо получилось, но не на всех страницах. Я не заметил, копируя 31 стр, что на некоторых страницах есть также видимо растровый шрифт (при масштабировании он квадратиками). стр17-18 - вот как он выглядит. Этот же учебник, страницы с таким "нехорошим" шрифтом. Без конвертации по вашему способу - все, как в моем первом сообщении: при обычном копировании выходят стрелки, кубики и т.п., при копировании с форматированием - нормальный текст. После конвертации там, где растровый шрифт - абракадабра остается. Этот шрифт в "свойства-шрифты" отмечен как type3 (см. img008)
 

Вложения

  • Image 008.png
    Image 008.png
    137.7 КБ · Просм.: 410

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 228
Реакции
10 851

ivan0899

Участник
Топикстартер
Сообщения
11
Реакции
0
... T"№ такой-то". Этих T"№..." около 234.
 

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 228
Реакции
10 851

german

20 лет на форуме
Сообщения
4 566
Реакции
649
После конвертации там, где растровый шрифт - абракадабра остается. Этот шрифт в "свойства-шрифты" отмечен как type3 (см. img008)
Бывали случаи, когда название шрифта совпадало с принтерным и он заменялся драйвером принтера при создании печатного файла.