Чистка OCR-а: минусы, тире, длинные тире

  • Автор темы Автор темы gasyoun
  • Дата начала Дата начала

gasyoun

Санскритятина
Топикстартер
15 лет на форуме
Сообщения
926
Реакции
30
Господа,

800 страниц текста "Махабхараты" в .doc - текст откорректирован после OCR. Но длиной черточек никто не озадачивался. Какие скрипты существуют для наведения порядка? Гуляют там и пробелы, конечно. Попытаюсь запустить "Методичку". В Индизайне скрипты Михаила Иванюшина - лучшее решение?

М.
 
В Индизайне скрипты Михаила Иванюшина - лучшее решение?
SZam Батушева мне больше нравится (привык); по функционалу они вроде как равнозначны. Для Word я тоже искал, но что-то не нашел. Проще вставить текст в Индизайн и так уже заниматься нормализацией
 
  • Спасибо
Реакции: gasyoun и MrDesigner
Я знаю, но VZam, все равно менее функционален, чем SZam, и к тому же только под Windows
Конечно. Тем более что к sZam'у (как, впрочем, и к DoTextOK!) можно цеплять свои наборы замен. Но вордовские макросы всё равно бывают полезны, особенно если обрабатывать текст не для последующей вёрстки, а оставаясь в пределах Ворда.
Я когда-то себе написал большую связку макросов, которой до сих пор пользуюсь, обрабатывая тексты до вёрстки, хотя всё это, разумеется, можно было бы перевести на DoTextOK или sZam. Просто я ленивый, а процесс уже отлажен :)) Мои макросы, правда, без интерфейса, а потому не очень удобны ни для кого, кроме меня :))
 
Ну у меня тоже существует такой самопальный набор макросов. :) Я вообще не заливаю текст в Индизайн, не поработав с ним в Ворде
 
  • Спасибо
Реакции: Валера1966 и LeonidB
Странно, что до сих пор не промелькнуло:
 
  • Спасибо
Реакции: AskMan
Странно, что до сих пор не промелькнуло
Я потому не упомянул, что, по моим воспоминаниям, были какие-то проблемы с установкой (или работой) в свежих версиях Ворда, а пакет этот автор давно уже не поддерживает.
 
Я потому не упомянул, что, по моим воспоминаниям, были какие-то проблемы с установкой (или работой) в свежих версиях Ворда, а пакет этот автор давно уже не поддерживает.

Да, он давненько умер.