Я программист и хотел бы посоветоваться со специалистами в издательском деле.
Насколько востребованы программы по проверке текстов?
Просто у нас уже есть некоторые наработки, и мы думаем, может быть, они будут полезны не только в нашей узкоспециализированной области.
Сейчас у нас есть две программы:
1) Проверки орфографии в группе документов.
Работает она следующим образом. Программе указывается каталог с документами. Она их просматривает, находит слова, которые отсутствуют в орфографическом словаре, и выдает список таких слов общим списком, с указанием количества документов, где они встретились. Дальше можно просмотреть в каких документах эти слова найдены.
2) Программа проверки по формальным признакам.
Пример таких проверок:
Напишите, пожалуйста, интересны ли кому-нибудь такие программы? Если интересны, то готовы ли вы заплатить за них небольшую сумму денег? Может быть нужны какие-то другие проверки?
Насколько востребованы программы по проверке текстов?
Просто у нас уже есть некоторые наработки, и мы думаем, может быть, они будут полезны не только в нашей узкоспециализированной области.
Сейчас у нас есть две программы:
1) Проверки орфографии в группе документов.
Работает она следующим образом. Программе указывается каталог с документами. Она их просматривает, находит слова, которые отсутствуют в орфографическом словаре, и выдает список таких слов общим списком, с указанием количества документов, где они встретились. Дальше можно просмотреть в каких документах эти слова найдены.
2) Программа проверки по формальным признакам.
Пример таких проверок:
- Проверка на отсутствие пробелов в сокращениях «т.д.», «т.п.» и подобных.
- Проверка на наличия пробела или другого разделяющего символа после сокращений («п.», «п.п.», «ст.» и др.).
- Проверка правильности написания дат (например, 10.12.20003, 32.03.2019, 01. 02.2018 и т.д.).
- Проверка на то, чтобы регистр слов и словосочетаний в тексте соответствовал заданным шаблонам (например, «Гражданский кодекс», «Уголовный кодекс» и др.).
- Проверка на то, чтобы в документе не было идущих друг за другом одинаковых абзацев или слов. Это может быть опечаткой.
- Находит в документах слова, которые похожи на слова из списка важных слов, то есть отличаются от них на одну букву.
- Находит в документах типовые опечатки, которые описаны в отдельном списке. При описании опечаток возможно использование символа «*» в начале и в конце опечатки. Звездочка означает любое начало или окончание слова (например, «В нести=Внести», «в сроке = в строке», «заложенност*=задолженност*» и др.).
- Проверка знаков препинания в конце абзацев.
- Поиск документов, у которых есть динамические таблицы, шириной больше 54 см.
- Поиск документов, содержащих текст в верхнем или нижнем индексе.
- Поиск документов, содержащих текст выделенный курсивом или жирным шрифтом.
- Поиск документов, у которых жирным или курсивным шрифтом выделена только часть слова.
- Поиск текста, похожего на интернет-ссылки. Признаками интернет-ссылок считаются наборы символов «www.», «http», «.ru», «com» и т.д.
- Проверка на ошибки в нумерации пунктов (например, когда абзацы нумеруются следующим образом 1), 2), 4), 5)),
Напишите, пожалуйста, интересны ли кому-нибудь такие программы? Если интересны, то готовы ли вы заплатить за них небольшую сумму денег? Может быть нужны какие-то другие проверки?