Составить реестр начал слов (первые три бувы)

  • Автор темы Автор темы gasyoun
  • Дата начала Дата начала
Статус
Закрыто для дальнейших ответов.

gasyoun

Санскритятина
Топикстартер
15 лет на форуме
Сообщения
926
Реакции
30
Господа, нужна Ваша помощь.
Термина не знаю, но возможно умные библиотекари знают. Спрашивал библиотекаря в ИВ РАНе, не подсказали. Имеется словарь, 1000 страниц. В нем слова идут в последовательности индийского алфавита (описана на php и VBA http://is.gd/HrRk0E или http://is.gd/tkKltc, на выбор).
Нужны два режима составления справочного аппарата. Искать 1) первые 2 или 2) 3 (и так и так) буквы каждого слова и указать на какой странице начинается это безобразие.
Получаем, например, над текстом (на новой строке), в самом начале страницы следующую вереницу: "au- auk- aug- augh- auṅ- auc- auj- auṇ- aut- aud- aun- aup- aum- aur- auv- auś- auṣ- aus- auh-."
При этом "ai, au, kh, gh, ch, jh, ṭh, ḍh, th, dh, ph, bh = 1 буква, а не 2".
Тире после слога/букв означает, что это начало слова. Разделитель пробел. В первой "трех-буквенной" бирке "au-" всего 1 буква, потому что это начало списка и там еще 2-й буквы попросту нет (au = 1 буква, а не 2).
Предпологается что текст идет в правильной (индийской) последовательности (a ā i ī u ū ṛ e ai o au k kh g gh c ch j jh ṭ ṭh ḍ ḍh t th d dh n p ph b bh m y r l v ś ṣ s h). Через неделю у меня предположительно будет VBA код проверки правильности последовательности (пишем сейчас), тогда разве что еще проверку встроить.
Слова в списке (список грязноват, откуда-то взялись повторы) в скобках могут иметь грамматическую метку, типа aukṣa (adj), но "(adj)" для нас не имеет значения, как и прочие метки. Несколько слов могут идти как подряд (aujjayanaka (adj), aujjvalya (n)), так и в столбик aukiraṇa (m) / aukthya (m). Перед словом может стоять знак математического корня - его тоже не берем в учет.
Справа от начала слова нужно добавить номер страницы, на котором он встречается в тексте. Получается "au- 1, auk- 1, aug- 1, augh- 4, auṅ- 4, auc- 5", где 1,4,5 - номера страниц. Чтобы сделать bookmark в документе на начало первого слова я даже и не мечтаю.
Спасибо, что дочитали, внизу пример списка слов.

au-

au (ind)
auk-

aukāra (m)
aukiraṇa (m)
aukthya (m)
aukṣa (adj)
aug-

augrya (n)
augh-

augha (m)
auṅ-

auṅ (m)
auc-

aucathya (m)
aucitī (f), aucitya (n)
auceyu (m)
auj-

aujasa (n)
aujasya (adj)
aujjayanaka (adj), aujjvalya (n)
auṇ-

auṇḍra (m)
aut-

autathya (m)
autkaṇṭhya (n), autkarṣya (n), autkārṣya (n)
auttaṅka (adj), auttama (adj), auttami (m), auttamīya (adj), auttara (adj), auttarakālika (adj), auttarabhaktika (adj), auttarāpatha (n), auttarāpathā (f), auttarāpathika (adj), auttarīya (adj), auttarottarya (n), auttānapāda (m), auttānapādi (m)
autpattika (adj), autpātika (adj)
autsukya (n)
aud-

audaka (adj)
audanika (m), audara (adj), audarika (adj), audarya (adj)
audārika (m), audārya (n), audāsīnya (n), audāsya (n)
audumbarī (f), audumbara (m), audumbara (n), audumbara (adj), audumbarya (adj)
audgātra (n)
auddāla (n), auddāla (m), auddālaki (m), auddālaka (n), auddālakīya (adj)
auddhatya (n)
audbhijja (adj), audbhida (adj), audbhida (n)
audvāhika (adj)
aun-

aunnatya (n)
aunmanasa (n), aunmādika (adj), aunmukhya (n)
aup-

aupakārika (adj)
aupakārya (adj), aupagavi (m), aupagava (adj), aupacayika (adj), aupacārika (adj), aupacchandasika (n), aupatyaka (adj), aupadaśvi (m), aupadeśika (adj), aupadravika (m), aupadhika (m), aupadhenava (m), aupanāyanika (adj), aupanāsika (adj), aupanidhika (adj), aupaniṣada (adj), aupaniṣadika (adj), aupapātika (adj), aupapādika (adj), aupapāduka (adj), aupamanyava (m), aupamya (n), aupayika (n), aupayika (adj), aupariṣṭaka (n), aupavāsya (n), aupavāhya (m), aupaśleṣika (adj), aupasargika (adj), aupasarpin (adj)
aupādhika (adj), aupāyanika (adj), aupāsana (m)
aupodghātika (adj)
aum-

aum (ind)
auma (adj), auma (adj)
aur-

auraga (adj)
aurabhra (adj), aurabhra (m), aurabhrika (adj), aurabhrika (m), aurasa (adj), aurasa (m), aurasa (adj), aurasaka (m)
aurjasthya (adj)
aurṇa (adj), aurṇika (m), aurṇika (adj)
aurdhvadeha (adj), aurdhvadehika (n), aurdhvadehika (adj), aurdhvadaihika (adj)
aurmya (m)
aurva (m), aurva (adj), aurva (n), aurvaśeya (m), aurvasaṃgama (m), aurvāgni (m), aurvānala (m), aurvyā (f)
auv-

auveṇaka (n)
auś-

auś (m)
auśana (adj), auśanasa (adj), auśanasa (n)
auśija (m), auśija (adj)
auśīnarī (f), auśīnara (adj), auśīra (n)
auṣ-

auṣa (n)
auṣadaśvi (m), auṣadhi (f), auṣadha (adj), auṣadhī (f), auṣadha (n), auṣadhavant (adj), auṣadhīka (m), auṣara (n), auṣaraka (n)
auṣṭra (adj), auṣṭraka (adj), auṣṭrika (adj)
auṣṇya (n)
aus-

ausaja (n)
auh-

auhoyikāra (m)

Все :)
 
Статус
Закрыто для дальнейших ответов.