- Сообщения
- 926
- Реакции
- 30
У меня книг .pdf целая коллекция. Книги по индийским языкам и лингвистике в целом.
Книги не только собираю, но и сканирую сам. Отсканировал тысячи страниц, разные редкости, словари - то есть знаю, что это такое и имею свои представление о том, почему .pdf, а не какой-нить очень компактный .djvu. Когда читаю книги, делаю OCR, чтобы интересные места иметь возможность выделать, подчеркывать.
Книга, отсканированная лично мною в ЧБ режиме проходит OCR за несколько минут - файл открывается быстро, книга помогает. Не больше 50-100 Мб, и то если это фолиант увеличенного размера больше 1000 страниц.
Но недавно заментил такую штуку. Файл 15 Мб после распознвания стал 391 Мб, а другие 2 и вовсе 1 гига дошли. WTF? Мало того, что JPEG2000 открывается каждая страница книги по полчаса, так еще такой размер? Чаще всего проблемы с книгами из Google Books. Что-то они там напортачили.
Если экспортировать файл через Adobe Professional как PDF уменьшенного размера можно снова вернуться к небольшым файлам, но уже размыто все, не красиво, не хорошо. Если экспортировать jpg файл по отдельности и заново собрать - тот же размер. Где выход? Что делать?
Пример испоганенной идеально четкой до этого книгой собственного скана.
Книги не только собираю, но и сканирую сам. Отсканировал тысячи страниц, разные редкости, словари - то есть знаю, что это такое и имею свои представление о том, почему .pdf, а не какой-нить очень компактный .djvu. Когда читаю книги, делаю OCR, чтобы интересные места иметь возможность выделать, подчеркывать.
Книга, отсканированная лично мною в ЧБ режиме проходит OCR за несколько минут - файл открывается быстро, книга помогает. Не больше 50-100 Мб, и то если это фолиант увеличенного размера больше 1000 страниц.
Но недавно заментил такую штуку. Файл 15 Мб после распознвания стал 391 Мб, а другие 2 и вовсе 1 гига дошли. WTF? Мало того, что JPEG2000 открывается каждая страница книги по полчаса, так еще такой размер? Чаще всего проблемы с книгами из Google Books. Что-то они там напортачили.
Если экспортировать файл через Adobe Professional как PDF уменьшенного размера можно снова вернуться к небольшым файлам, но уже размыто все, не красиво, не хорошо. Если экспортировать jpg файл по отдельности и заново собрать - тот же размер. Где выход? Что делать?
Пример испоганенной идеально четкой до этого книгой собственного скана.