Подскажите скрипт для подготовки индекса

Статус
Закрыто для дальнейших ответов.

Pavel Karpov

Топикстартер
15 лет на форуме
Сообщения
76
Реакции
14
Интересует скрипт, результатом работы которого будет текстовый файл, содержащий все слова, входящие в документ. На самом деле интересуют только неоднобуквенные слова, начинающиеся с заглавной буквы.
 

Валера1966

15 лет на форуме
Сообщения
1 291
Реакции
1 391
Ответ: Подскажите скрипт для подготовки индекса

В полуавтоматическом режиме проще всего так сделать.
Экспортировать всё в текстовый файл.
Открыть в Word. Заменить все пробелы, запятые и проч. знаки препинания на пробел.
Преобразовать в одностолбцовую таблицу, разделитель—пробел.
Получите длинную таблицу.
Её скопируйте в Excel.
Там отсортируйте сначала по длине строки (то есть 1) вычислите для каждой строки (то есть каждого слова) её дину (ДЛСТР(ХХХ))—это будет второй столбец; 2) отсортируйте по длине строки—по второму столбцу; 3) удалите все строки с длиной=1).
(ХХХ—это код очередной ячейки типа А1 и т. д.)

Второй раз надо сортировать по первому символу слов. Заглавная буква имеет другой код символа, чем строчная.

Делаете третий столбец как формула =КОДСИМВ(ПСТР(ХХХ;1;1))
Получите коды символов первых литер слов каждой строки.
И сортируйте по третьему столбцу.
Получите группу строк, слова в которых начинаются с заглавных.

(Засада кроется в том, что не все заглавные символы могут идти сплочённой группой в Таблице кодов символов, но можно полистать вручную и осмотреть всё.)

Успехов!
 

Pavel Karpov

Топикстартер
15 лет на форуме
Сообщения
76
Реакции
14
Ответ: Подскажите скрипт для подготовки индекса

Отыскал скрипт IndexMatic. Он собирает индекс всех слов в текстовик и сортирует по алфавиту, причем заглавные ставит вначале списка. Опционально убирает одно- и двухбуквенные слова.
 
Статус
Закрыто для дальнейших ответов.