Сканирование и обработка старинных книг

Статус
Закрыто для дальнейших ответов.

mina

Участник
Топикстартер
Сообщения
278
Реакции
15
В данном случае Коран 19 века.

Велено воостановить. Печать будет черно-белая.

Как его в более-менее светский вид привести?
Одним Levels тут не обойдется.
Может кто знает секреты обработки старинных книг? Там проблема в "теряющий" буквах.

3 вариант-DSCF1160_2.
То, что я смогла сделать.....самый лучший'))'))))
Ручками 300 стр. формата А3 муторно. Профи, посоветуйте, может есть урок какой?
 

Вложения

  • DSCF1159_2.jpg
    DSCF1159_2.jpg
    117.5 КБ · Просм.: 1 203
  • DSCF1160_2.jpg
    DSCF1160_2.jpg
    88.3 КБ · Просм.: 831
  • DSCF1157_2.jpg
    DSCF1157_2.jpg
    141.6 КБ · Просм.: 1 150

zemnoy

out of space
15 лет на форуме
Сообщения
352
Реакции
0
Ответ: Сканирование и обработка старинных книг

А корректор есть который потом ошибки будет вычитывать? (это же тоже этап обработки) И как узнать это элемент текста или грязное пятнышко на книге? Тут ведь и еретиком прослыть недолго :)
 

zemnoy

out of space
15 лет на форуме
Сообщения
352
Реакции
0
Ответ: Сканирование и обработка старинных книг

mina сказал(а):
Может кто знает секреты обработки старинных книг?
Думаю можно так, сканировать в RGB, там помаксимуму пробовать кривыми(!!!) темнить (увеличивать значение на темных участках) потом в CMYK и черный канал - ваш текст, пробовал в РРХ4 т.к. на работе только он :+(( думаю Photoshop справится лучше
 

mina

Участник
Топикстартер
Сообщения
278
Реакции
15
Ответ: Сканирование и обработка старинных книг

zemnoy сказал(а):
А корректор есть который потом ошибки будет вычитывать? (это же тоже этап обработки) И как узнать это элемент текста или грязное пятнышко на книге? Тут ведь и еретиком прослыть недолго :)

:) хорошее замечание. Поэтому никто и не хочет взятся.
Если сделаем, распечатаем 1 экз. заказчику, для чтения.

Насчет смик-овских каналав...да, я так сделала. Всеравно стремно как то, потеряется еще что...
 

JAW

15 лет на форуме
Сообщения
15 796
Реакции
3 454
Ответ: Сканирование и обработка старинных книг

Очень сложный случай...
Сканировать в RGB 1200 ppi, руками выбирать уровнями...
Преобразовывать в 1200 dpi (b/w)

Можно пробовать в Gray, но боюсь что-то может потеряться.
 

JAW

15 лет на форуме
Сообщения
15 796
Реакции
3 454
Ответ: Сканирование и обработка старинных книг

Да, был софт, который корректирует линейные и прочие искажения...
Нужно поспрашать на форумах, где сканеровщики книг тусуются...
 

velosipedov

Участник
Сообщения
3
Реакции
0
Ответ: Сканирование и обработка старинных книг

приходилось делать репринт изданий 20 века. на арабском языке. все, что возможно было сделать это
1) крутить настройки сканера, чтобы сканировать с наименьшими помехами. 300 дпи мне было достаточно.
2) dust and scratch (3, 0) чтобы убрать дыры в буквах
3) levels (input 15-25%) но в вашем случае может быть иначе
4) showdows highlights (26%, 36%)
5) unsharp mask (300%, 9,8px, 0)
в принципе такой обработки мне хватало, но руками приходилось крупные точки убирать, конечно. выравнивалось, подрихтовывался размер, затем в пдф.
 

zemnoy

out of space
15 лет на форуме
Сообщения
352
Реакции
0
Ответ: Сканирование и обработка старинных книг

А вообще распознать, вязь, реально у нас в РФ???
 

Specialist

15 лет на форуме
Сообщения
2 035
Реакции
8
Ответ: Сканирование и обработка старинных книг

zemnoy сказал(а):
А вообще распознать, вязь, реально у нас в РФ???

Сомнительно. Я не спец по арабскому языку, но то, что видно на изображениях мало похоже на современную вязь.
 

Psy

няша
20 лет на форуме
Сообщения
3 581
Реакции
2 279
Ответ: Сканирование и обработка старинных книг

Specialist сказал(а):
Сомнительно. Я не спец по арабскому языку, но то, что видно на изображениях мало похоже на современную вязь.
но ведь зачем-то эту книгу печатают ) кто-то будет ее читать

Земной, можно попробовать обратиться в ближайшую мечеть. тем паче тут Коран.
 

denisgrim

Участник
Сообщения
1 171
Реакции
1
Ответ: Сканирование и обработка старинных книг

mina сказал(а):
Может кто знает секреты обработки старинных книг? Там проблема в "теряющий" буквах.
Попробуйте шумодавку Neat Image - она поможет убрать текстуру бумаги, не убив мелкие точки. Это гораздо бережнее, чем фильтр Dust&Scratches.
И ещё, наверное стоит включить в процесс какой-нибудь трассировщик...
 

mpolozova

Участник
Сообщения
3
Реакции
0
Ответ: Сканирование и обработка старинных книг

Во-первых, статья до кучи - Сканирование книг
Во-вторых, совет на будущее. Подобную литературу надобно сканировать профессиональными книжными сканерами и ничем более. Причем, желательно, на основе цифровых фотоаппаратов, так как разрешение у изображений с профессиональных фотокамер высочайшее и следовательно, проблемы с распознаванием текста стремяться к нулю.
Если не секрет, Вы чем сканировали?
 

zemnoy

out of space
15 лет на форуме
Сообщения
352
Реакции
0
Ответ: Сканирование и обработка старинных книг

mpolozova сказал(а):
так как разрешение у изображений с профессиональных фотокамер высочайшее и следовательно, проблемы с распознаванием текста стремяться к нулю
это репродукция, как я понимаю, хорошо использовать светлый объектив 50 мм и штатив, тогда оригинал может качественно увеличиться и обрабатывать RAW... Вот только как распознать?
 

mpolozova

Участник
Сообщения
3
Реакции
0
Ответ: Сканирование и обработка старинных книг

штатив используется, если речь идет о сканировании дома. что же касается профессиональных книжных сканеров, штатив не требуется, так как имеется специальная конструкция и есть возможность настроить фотокамеры идеальным образом.

самое лучшее ПО для распознавания - без сомнения, ABBYY Finereader. :) читала, версия 8.0 была признана по результатам теста идеальной по совместимости с профессиональным оборудованием для оцифровки книг. И, кстати, ПО ABBYY также использует Microsoft в своих проектах по сохранению ценного книжного фонда...
 

Supremus

15 лет на форуме
Сообщения
521
Реакции
84
Ответ: Сканирование и обработка старинных книг

mina сказал(а):
:)
Насчет смик-овских каналав...да, я так сделала. Всеравно стремно как то, потеряется еще что...

Перевод в CMYK при таком репродуцировании можно ещё использовать так: Надо в настройках конвертации в CМYK указать минимально возможный TIL - 200%, а со способом генерации черного поигратся - посмотреть, при каком параметре получается наибольший контраст между текстом и фоном в черном канале.
На приложенном примере Искходное RGB, и черный канал полученный при TIL-200% и Black Generation - Light. Впрочем, мой пример сканировался планшетником. так что запас по разрешению там был немеряный.
 

Вложения

  • primer.jpg
    primer.jpg
    51.4 КБ · Просм.: 1 083

@diz@

отечеств. про
15 лет на форуме
Сообщения
4 220
Реакции
1 914
Ответ: Сканирование и обработка старинных книг

Очень странная постановка задачи: "велено восстановить".
Значит "велите" им пригласить переводчика с арабского, причём - хорошего. Он должен указать стрёмные моменты, а остальное - дело техники.
Ну вязь, ну и что? Если бы вам дали сканировать русский текст, были бы вопросы? Наверняка нет. Потому что вы сами можете всё дораспознать. Алфавит/язык нужно знать, чтобы эта работа была успешной. А посему - не помогут вам цмики-фигики и т.п. Гадание на кофейной гуще. И ошибки могут быть весьма неприятные. Тем более, для верующих людей, они всегда более ранимы искажениями смысла.
Так что подумайте, прежде чем взяться.
 

JAW

15 лет на форуме
Сообщения
15 796
Реакции
3 454
Ответ: Сканирование и обработка старинных книг

Да о чём вы вообще говорите? Я жеж собаку съел уже на таких вещах...
На выходе (для качественного полиграфического воспроизведения) вы ДОЛЖНЫ получить b/w 1200 dpi минимум. Тогда никто и не поймёт, что это скан, подумают, что типо набор...

Как до этих 1200 дойти... Есть два варианта:
1) Сканировать 1200 DPI b/w. Пригодно для более-менее качественных оригиналов, отдельных листов, которые не будут нуждаться в исправлении геометрии.
2) Сканировать b/w Gray. Для нрмальных вариантов, тогда останется убрать только фон бумаги, но такой режим позволит используя специальные программы выправить искривления у корешка и прочую геометрию. Потом в Шопе, или тех же программах гоним всё в 1200 b/w
3) Если оригинал очень сложный и первые 2 варианта не тянут (не удаётся выделить собственно чёрный текст, то полноцвет на том же разрешении).
Потом по каналам выбираем самый информативный, доводим до Gray, убираем бумагу и в b/w по 50% алгоритму.

Должен заметить, что мелкий шум (редкие точки маленькой площади и т.п. убирать не обязательно).

И, что самое важное... На экране вы никак не сможете оценить эффективность и качесто результата. Всё будет выглядеть достаточно погано.
Печатайте на лазерник с физическим разрешением 1200 dpi. Тлько тогда вы видите что получается и что нужно исправлять.
 

JAW

15 лет на форуме
Сообщения
15 796
Реакции
3 454
Ответ: Сканирование и обработка старинных книг

mina

Большая просьба...
Отсканируйте этот же кусок в RGB с отключенной цветокоррекцией на 1200 ppi, запишите TIFF (с какой комрессией, но не JPEG), положите на файлообменник.
Попытаюсь показать что можно сделать.
 

mina

Участник
Топикстартер
Сообщения
278
Реакции
15
Ответ: Сканирование и обработка старинных книг

@zemnoy А вообще распознать, вязь, реально у нас в РФ???

Наверное можно. Если современный шрифт.

Эта книга единственный экземпляр своего рода. Напечатано в Казанской типографии в 19 веке. Раньше Коран там печатали.
Да и зачем распозновать то? Цель же не печать Корана (для желающих его читать в магазинах немерено), а сохранение единственного экземпляра на будущее. Оригинал рассыпается уже.

Такие книги фотографируются или отсканируются с хорошим качеством и печатаются как есть (если есть в этом необходимость, ведь можно хранить и в электронном виде...для потомков'))'))).

@JAW Большая просьба...
исполнено. Точно такой не получился, но чуть есть.
 

Вложения

  • 1200 dpi.rar
    188.3 КБ · Просм.: 358

zemnoy

out of space
15 лет на форуме
Сообщения
352
Реакции
0
Ответ: Сканирование и обработка старинных книг

mina сказал(а):
Такие книги фотографируются или отсканируются с хорошим качеством и печатаются как есть (если есть в этом необходимость, ведь можно хранить и в электронном виде...для потомков
Я поправлю "КАК ЕСТЬ..." и нет никаких проблем с пропавшими частями текста, а ценители даже будут вам благодарны за такой оригинал. А сама задача интересная, поупражнятся, ваш файлик посмотрю
 
Статус
Закрыто для дальнейших ответов.