Подскажите скрипт для подготовки индекса

Pavel Karpov · 16.08.2011

Интересует скрипт, результатом работы которого будет текстовый файл, содержащий все слова, входящие в документ. На самом деле интересуют только неоднобуквенные слова, начинающиеся с заглавной буквы.

Валера1966 · 16.08.2011

Ответ: Подскажите скрипт для подготовки индекса

В полуавтоматическом режиме проще всего так сделать.
Экспортировать всё в текстовый файл.
Открыть в Word. Заменить все пробелы, запятые и проч. знаки препинания на пробел.
Преобразовать в одностолбцовую таблицу, разделитель—пробел.
Получите длинную таблицу.
Её скопируйте в Excel.
Там отсортируйте сначала по длине строки (то есть 1) вычислите для каждой строки (то есть каждого слова) её дину (ДЛСТР(ХХХ))—это будет второй столбец; 2) отсортируйте по длине строки—по второму столбцу; 3) удалите все строки с длиной=1).
(ХХХ—это код очередной ячейки типа А1 и т. д.)

Второй раз надо сортировать по первому символу слов. Заглавная буква имеет другой код символа, чем строчная.

Делаете третий столбец как формула =КОДСИМВ(ПСТР(ХХХ;1;1))
Получите коды символов первых литер слов каждой строки.
И сортируйте по третьему столбцу.
Получите группу строк, слова в которых начинаются с заглавных.

(Засада кроется в том, что не все заглавные символы могут идти сплочённой группой в Таблице кодов символов, но можно полистать вручную и осмотреть всё.)

Успехов!

Pavel Karpov · 16.08.2011

Ответ: Подскажите скрипт для подготовки индекса

Отыскал скрипт IndexMatic. Он собирает индекс всех слов в текстовик и сортирует по алфавиту, причем заглавные ставит вначале списка. Опционально убирает одно- и двухбуквенные слова.

Подскажите скрипт для подготовки индекса

Pavel Karpov

Валера1966

Pavel Karpov