Сканирование и обработка старинных книг

  • Автор темы Автор темы mina
  • Дата начала Дата начала
Статус
Закрыто для дальнейших ответов.

mina

Участник
Топикстартер
Сообщения
278
Реакции
15
В данном случае Коран 19 века.

Велено воостановить. Печать будет черно-белая.

Как его в более-менее светский вид привести?
Одним Levels тут не обойдется.
Может кто знает секреты обработки старинных книг? Там проблема в "теряющий" буквах.

3 вариант-DSCF1160_2.
То, что я смогла сделать.....самый лучший:))))))
Ручками 300 стр. формата А3 муторно. Профи, посоветуйте, может есть урок какой?
 

Вложения

  • DSCF1159_2.jpg
    DSCF1159_2.jpg
    117.5 КБ · Просм.: 1 225
  • DSCF1160_2.jpg
    DSCF1160_2.jpg
    88.3 КБ · Просм.: 852
  • DSCF1157_2.jpg
    DSCF1157_2.jpg
    141.6 КБ · Просм.: 1 173
Ответ: Сканирование и обработка старинных книг

А корректор есть который потом ошибки будет вычитывать? (это же тоже этап обработки) И как узнать это элемент текста или грязное пятнышко на книге? Тут ведь и еретиком прослыть недолго :)
 
Ответ: Сканирование и обработка старинных книг

mina сказал(а):
Может кто знает секреты обработки старинных книг?
Думаю можно так, сканировать в RGB, там помаксимуму пробовать кривыми(!!!) темнить (увеличивать значение на темных участках) потом в CMYK и черный канал - ваш текст, пробовал в РРХ4 т.к. на работе только он :(( думаю Photoshop справится лучше
 
Ответ: Сканирование и обработка старинных книг

zemnoy сказал(а):
А корректор есть который потом ошибки будет вычитывать? (это же тоже этап обработки) И как узнать это элемент текста или грязное пятнышко на книге? Тут ведь и еретиком прослыть недолго :)

:) хорошее замечание. Поэтому никто и не хочет взятся.
Если сделаем, распечатаем 1 экз. заказчику, для чтения.

Насчет смик-овских каналав...да, я так сделала. Всеравно стремно как то, потеряется еще что...
 
Ответ: Сканирование и обработка старинных книг

Очень сложный случай...
Сканировать в RGB 1200 ppi, руками выбирать уровнями...
Преобразовывать в 1200 dpi (b/w)

Можно пробовать в Gray, но боюсь что-то может потеряться.
 
Ответ: Сканирование и обработка старинных книг

Да, был софт, который корректирует линейные и прочие искажения...
Нужно поспрашать на форумах, где сканеровщики книг тусуются...
 
Ответ: Сканирование и обработка старинных книг

приходилось делать репринт изданий 20 века. на арабском языке. все, что возможно было сделать это
1) крутить настройки сканера, чтобы сканировать с наименьшими помехами. 300 дпи мне было достаточно.
2) dust and scratch (3, 0) чтобы убрать дыры в буквах
3) levels (input 15-25%) но в вашем случае может быть иначе
4) showdows highlights (26%, 36%)
5) unsharp mask (300%, 9,8px, 0)
в принципе такой обработки мне хватало, но руками приходилось крупные точки убирать, конечно. выравнивалось, подрихтовывался размер, затем в пдф.
 
Ответ: Сканирование и обработка старинных книг

А вообще распознать, вязь, реально у нас в РФ???
 
Ответ: Сканирование и обработка старинных книг

zemnoy сказал(а):
А вообще распознать, вязь, реально у нас в РФ???

Сомнительно. Я не спец по арабскому языку, но то, что видно на изображениях мало похоже на современную вязь.
 
Ответ: Сканирование и обработка старинных книг

Specialist сказал(а):
Сомнительно. Я не спец по арабскому языку, но то, что видно на изображениях мало похоже на современную вязь.
но ведь зачем-то эту книгу печатают ) кто-то будет ее читать

Земной, можно попробовать обратиться в ближайшую мечеть. тем паче тут Коран.
 
Ответ: Сканирование и обработка старинных книг

mina сказал(а):
Может кто знает секреты обработки старинных книг? Там проблема в "теряющий" буквах.
Попробуйте шумодавку Neat Image - она поможет убрать текстуру бумаги, не убив мелкие точки. Это гораздо бережнее, чем фильтр Dust&Scratches.
И ещё, наверное стоит включить в процесс какой-нибудь трассировщик...
 
Ответ: Сканирование и обработка старинных книг

Во-первых, статья до кучи - Сканирование книг
Во-вторых, совет на будущее. Подобную литературу надобно сканировать профессиональными книжными сканерами и ничем более. Причем, желательно, на основе цифровых фотоаппаратов, так как разрешение у изображений с профессиональных фотокамер высочайшее и следовательно, проблемы с распознаванием текста стремяться к нулю.
Если не секрет, Вы чем сканировали?
 
Ответ: Сканирование и обработка старинных книг

mpolozova сказал(а):
так как разрешение у изображений с профессиональных фотокамер высочайшее и следовательно, проблемы с распознаванием текста стремяться к нулю
это репродукция, как я понимаю, хорошо использовать светлый объектив 50 мм и штатив, тогда оригинал может качественно увеличиться и обрабатывать RAW... Вот только как распознать?
 
Ответ: Сканирование и обработка старинных книг

штатив используется, если речь идет о сканировании дома. что же касается профессиональных книжных сканеров, штатив не требуется, так как имеется специальная конструкция и есть возможность настроить фотокамеры идеальным образом.

самое лучшее ПО для распознавания - без сомнения, ABBYY Finereader. :) читала, версия 8.0 была признана по результатам теста идеальной по совместимости с профессиональным оборудованием для оцифровки книг. И, кстати, ПО ABBYY также использует Microsoft в своих проектах по сохранению ценного книжного фонда...
 
Ответ: Сканирование и обработка старинных книг

mina сказал(а):
:)
Насчет смик-овских каналав...да, я так сделала. Всеравно стремно как то, потеряется еще что...

Перевод в CMYK при таком репродуцировании можно ещё использовать так: Надо в настройках конвертации в CМYK указать минимально возможный TIL - 200%, а со способом генерации черного поигратся - посмотреть, при каком параметре получается наибольший контраст между текстом и фоном в черном канале.
На приложенном примере Искходное RGB, и черный канал полученный при TIL-200% и Black Generation - Light. Впрочем, мой пример сканировался планшетником. так что запас по разрешению там был немеряный.
 

Вложения

  • primer.jpg
    primer.jpg
    51.4 КБ · Просм.: 1 107
Ответ: Сканирование и обработка старинных книг

Очень странная постановка задачи: "велено восстановить".
Значит "велите" им пригласить переводчика с арабского, причём - хорошего. Он должен указать стрёмные моменты, а остальное - дело техники.
Ну вязь, ну и что? Если бы вам дали сканировать русский текст, были бы вопросы? Наверняка нет. Потому что вы сами можете всё дораспознать. Алфавит/язык нужно знать, чтобы эта работа была успешной. А посему - не помогут вам цмики-фигики и т.п. Гадание на кофейной гуще. И ошибки могут быть весьма неприятные. Тем более, для верующих людей, они всегда более ранимы искажениями смысла.
Так что подумайте, прежде чем взяться.
 
Ответ: Сканирование и обработка старинных книг

Да о чём вы вообще говорите? Я жеж собаку съел уже на таких вещах...
На выходе (для качественного полиграфического воспроизведения) вы ДОЛЖНЫ получить b/w 1200 dpi минимум. Тогда никто и не поймёт, что это скан, подумают, что типо набор...

Как до этих 1200 дойти... Есть два варианта:
1) Сканировать 1200 DPI b/w. Пригодно для более-менее качественных оригиналов, отдельных листов, которые не будут нуждаться в исправлении геометрии.
2) Сканировать b/w Gray. Для нрмальных вариантов, тогда останется убрать только фон бумаги, но такой режим позволит используя специальные программы выправить искривления у корешка и прочую геометрию. Потом в Шопе, или тех же программах гоним всё в 1200 b/w
3) Если оригинал очень сложный и первые 2 варианта не тянут (не удаётся выделить собственно чёрный текст, то полноцвет на том же разрешении).
Потом по каналам выбираем самый информативный, доводим до Gray, убираем бумагу и в b/w по 50% алгоритму.

Должен заметить, что мелкий шум (редкие точки маленькой площади и т.п. убирать не обязательно).

И, что самое важное... На экране вы никак не сможете оценить эффективность и качесто результата. Всё будет выглядеть достаточно погано.
Печатайте на лазерник с физическим разрешением 1200 dpi. Тлько тогда вы видите что получается и что нужно исправлять.
 
Ответ: Сканирование и обработка старинных книг

mina

Большая просьба...
Отсканируйте этот же кусок в RGB с отключенной цветокоррекцией на 1200 ppi, запишите TIFF (с какой комрессией, но не JPEG), положите на файлообменник.
Попытаюсь показать что можно сделать.
 
Ответ: Сканирование и обработка старинных книг

@zemnoy А вообще распознать, вязь, реально у нас в РФ???

Наверное можно. Если современный шрифт.

Эта книга единственный экземпляр своего рода. Напечатано в Казанской типографии в 19 веке. Раньше Коран там печатали.
Да и зачем распозновать то? Цель же не печать Корана (для желающих его читать в магазинах немерено), а сохранение единственного экземпляра на будущее. Оригинал рассыпается уже.

Такие книги фотографируются или отсканируются с хорошим качеством и печатаются как есть (если есть в этом необходимость, ведь можно хранить и в электронном виде...для потомков:))))).

@JAW Большая просьба...
исполнено. Точно такой не получился, но чуть есть.
 

Вложения

Ответ: Сканирование и обработка старинных книг

mina сказал(а):
Такие книги фотографируются или отсканируются с хорошим качеством и печатаются как есть (если есть в этом необходимость, ведь можно хранить и в электронном виде...для потомков
Я поправлю "КАК ЕСТЬ..." и нет никаких проблем с пропавшими частями текста, а ценители даже будут вам благодарны за такой оригинал. А сама задача интересная, поупражнятся, ваш файлик посмотрю
 
Статус
Закрыто для дальнейших ответов.