Составление лексического конкорданса

  • Автор темы Автор темы gasyoun
  • Дата начала Дата начала
Статус
Закрыто для дальнейших ответов.

gasyoun

Санскритятина
Топикстартер
15 лет на форуме
Сообщения
926
Реакции
30
Что скрипт http://www.kahrel.plus.com/indesign/index_concordance.html умеет обрабатывать большой объем данных, проверил на букве "а". Получилось 34 страницы А4 с упоминанием буквы "а", скрипт обработал документ за полминуты и ни разу не запнулся. Пробовал две буквы подряд, "av", тоже все отлично. Но, похоже, он не умеет обрабатывать сразу два значения (через запятую), например "av, as", выдает ошибку (см. скриншот). Возможно мне и не надо, чтобы он умел работать через запятую. Но мой список из 807 лигатур нужно обработать,
1) пусть даже скрипт запустится (лишь бы не мни клацать на запуск) 807 раз
2) но лишь бы не породил новых 807 файлов безымянных, нельзя ли, добавив строчку другую, чтобы он с разрывом страницы копировал в один и тот же лист? Есть ли умная книжка, написанная на темы скриптинга в инди?
Мне нужно увидеть как в конкретном тексте визуально представлены лигатуры, правильно ли они собраны, или имеется некоторая псевдо сборка (с теми же вирамами). Берем лигатуру ddh и остальные 806 по спику и пробегаем глазами.
После запуска имеем:
1) Новый лист, который выдает concordance.jcx по умолчанию имеет дефолтный Minion Pro (не содержит нужных диакритик). Как сделать, чтобы он присваивал заданный мною абзацный стиль (с шрифтом, который содержит диакритики)?
2) concordance.jcx показывает номер страницы. Может ли показывать, помимо этого:
- номер строки на странице
- номер строки на странице одной главы (при этом, если на странице начинается новая глава, то в ней считать с 0, не продолжая)
-- в первой половине или второй половине строки встречается (строка примерно одинаковой длины). Как решить математически пока не знаю, не смог найти подобных исследований индийских математиков,
- номер строки среди других строк на письме дэванагари (санскритский текст, оформлен единым или несколькими известными заранее стилями абзаца)
- из какой главы взято (как бегущие заголовки в колонтитуле)
Может ли:
3) останавливаться на стоп-словах, что до, что после, например, "||" (это "двойная данда", равна точке в санскрите)?
Других строителей конкорданса внутри InDesign не встречал. Этот прост, но в этом его заманчивость. Возможно он изначально правильно сконструирован и есть на чем накручивать. Ниже список того, что хочу проверить.

C. Liste der 807 tatsächlich belegten Sanskrit-Ligaturen (содержит расширенную латиницу)
5 Konsonanten: rtsny
4 Konsonanten: ktry, ktvy, kṣṇy, kṣmy, kstr, gdvy, gdhry, ṅkty, ṅktr, ṅktv, ṅkṣṇ, ṅkṣm, ṅkṣy, ṅkṣv, ṅgdhy, ṅgdhv, ṅghry, tkṣm, tkṣv, ttry, tstr, tsthy, tspr, tsphy, ddvy, nttv, ntry, ntvy, ntst, ntsth, ntsn, ntsp, ntsy, ntsr, ntsv, nddhy, nddhv, ndry, ndvy, ndhry, nstr, nsphy, ptry, psny, rkṣṇ, rkṣy, rksv, rṅgy, rjmy, rttr, rtny, rtry, rtvy, rtsn, rtsy, rddhy, rdry, rdvy, rdhny, rśvy, rṣṭy, rṣṇy, lgvy, ṣṭry, stry, sthny
3 Konsonanten: kkr, kkl, kkv, kkṣ, kty, ktr, ktv, kthn, kthy, kny,kpr, kpl, kmy, kry, kly, kśm, kśr, kśl, kśv, kṣṇ, kṣm, kṣy, kṣr, kṣv, kst, ksth, ksn, ksp, ksph, ksm, ksy, ksr, ksv, ggr, gghy, gghr, gjñ, gjy, gjv, gdy, gdr, gdv, gdhy, gdhr, gdhv, gny, gbr, gbhy, gbhr, gmy, gry, grv, gvy, gvr, ghny, ghry, ghvy, ṅkt, ṅkth, ṅky, ṅkr, ṅkl, ṅkv, ṅkṣ, ṅks, ṅkhy, ṅgdh, ṅgy, ṅgr, ṅgv, ṅghn, ṅghy, ṅghr, ṅtr, ṅtv, ṅdhy, ṅny, ṅnr, ṅpr, ṅvy, ṅvr, ṅsv, ccy, cchm, cchy, cchr, cchl, cchv, cñy, jjñ, jjy, jjv, jjhy, jñy, jñv, jmy, jry, jvy, ñcm, ñcy, ñcv, ñchn, ñchy, ñchr, ñchl, ñchv, ñjñ, ñjm, ñjy, ñjv, ñśm, ñśy, ñśr, ñśl, ñśv, ṭkr, ṭkṣ, ṭṭy, ṭtr, ṭtv, ṭpr, ṭśr, ṭśl, ṭst, ṭsth, ṭsn, ṭsp, ṭsv, ḍgy, ḍgr, ḍghr, ḍjñ, ḍjy, ḍḍhy, ḍḍhv, ḍdv, ḍbr, ḍbhy, ḍbhr, ḍvy, ṇṭy, ṇṭhy, ṇḍḍh, ṇḍy, ṇḍr, ṇḍv, ṇḍhy, ṇḍhr, ṇvy, tky, tkr, tkl, tkv, tkṣ, tkhy, ttn, ttm, tty, ttr, ttv, tts, tthy, tny, tnv, tpr, tpl, tmy, tyv, try, trv, tvy, tsk tskh, tst, tsth, tsn, tsp, tsph, tsm, tsy, tsr, tsv, thny, thvy, dgr, dgl, dghn, dghr, ddy, ddr, ddv, ddhm, ddhy, ddhr, ddhv, dbr, dbhy, dbhr, dbhv, dmy, dry, drv, dvy, dvr, dhny, dhry, dhvy, dhvr, nkr, nkl, nkv, nkṣ, nkhy, ngr, ngl, nghn, nghr, ntt, ntth, ntm, nty, ntr, ntv, nts, nthy, nddh, ndm, ndy, ndr, ndv, ndhm, ndhy, ndhr, ndhv, nny, nnv, npr, npl, nps, nbr, nbhr, nmy, nmr, nml, nyv, nvy, nvr, nsk, nskh, nst, nsth, nsn, nsp, nsph, nsm, nsy, nsr, nsv, nhy, nhr, nhv, pkṣ, pty, ptr, ptv, pny, ppr, pry, pśy, psn, psy, psv, bgr, bjy, bdy, bdhy, bdhv bbr, bbhy, bvy, bhry, bhrv, bhvy, mny, mpy, mpr, mpl, mps, mby, mbr, mbv, mbhy, mbhr, mmy, mmr, mml, mry, rkc, rkt, rkth, rkp, rky, rkṣ, rks, rkhy, rgg, rggh, rgj, rgbh, rgy, rgr, rgl, rgv, rghn, rghy, rghr, rṅkh, rṅg, rcch, rcy, rjñ, rjm, rjy, rjv, rñj, rḍy, rḍhy, rṇṇ, rṇy, rṇv, rtt, rtn, rtm, rty, rtr, rtv, rts, rthy, rddh, rdm, rdy, rdr, rdv, rdhn, rdhm, rdhy, rdhr, rdhv, rny, rnv, rpy, rbr, rbhy, rbhr, rbhv, rmy, rmr, rml, ryy, rvy, rvr, rvl, rśm, rśy, rśv, rṣṭ, rṣṭh, rṣṇ, rṣm, rṣy, rṣv, rsr, rsv, rhy, rhr, rhl, rhv, lky, lgv, lpy, lby, lbhy, lly, lvy, lhy, vny, ścy, śny, śmy, śry, śrv, śvy, ṣky, ṣkr, ṣkl, ṣkv, ṣkṣ, ṣṭy, ṣṭr, ṣṭv, ṣṭhy, ṣṭhv, ṣṇy, ṣṇv, ṣpy, ṣpr, ṣpl, ṣmy, skr, stm, sty, str, stv, sts, sthn, sthy, sny, spr, sphy, smy, sry, svy, ssy, ssv, hny, hmy, hvy
2 Konsonanten: kk, kkh, kc, kch, kṇkt, kth, kn, kp, kph, km, ky, kr, kl, kv, kś, kṣ, ks, kh, kh, kh, nk, hy, khv, gg, ggh, gj, gḍ, gṇ, gd, gdh, gn, gb, gbh, gm, gy, gr, gl, gv, ghn, ghm, ghy, ghr, ghv, ṅk, ṅkh, ṅg, ṅgh, ṅṅ, ṅc, ṅj, ṅt, ṅd, ṅdh, ṅn, ṅp, ṅbh, ṅm, ṅy, ṅr, ṅv, ṅś, ṅs, ṅh, cc, cch, cñ, cm, cy, cr, cv, chy, jj, jjh, jñ, jm, jy, jr, jv, jh, jhñ, cñ, ch, ñj, ñjh, ñś, ṭk, ṭkh, ṭc, ṭch, ṭṭ, ṭṇ, ṭt, ṭp, ṭph, ṭm, ṭy, ṭv, ṭś, ṭṣ, ṭs, ṭhy, ḍg, ḍgh, ḍj, ḍḍ, ḍḍh, ḍd, ḍdh, ḍb, ḍbh, ḍm, ḍy, ḍr, ḍl, ḍv, ḍhy, ḍhr, ḍhv, ṇṭ, ṇṭh, ṇḍ, ṇḍh, ṇṇ, ṇn, ṇm, ṇy, ṇv, tk, tkh, tt, tth, tn, tp, tph, tm, ty, tr, tv, tṣ, ts, thn, thy, thr, thv, dg, dgh, dd, ddh, dn, db, dbh, dm, dy, dr, dv, dhn, dhm, dhy, dhr, dhv, nkn, khn, gn, ghn, tn, thn, dn, dhn, nn, pn, phn, bn, bhn, mn, yn, rn, vn, ṣn, snh, pk, pkh, pc, pch, pṭ, pṇ, pt, pn, pp, pph, pm, py, pr, pl, pv, pś, ps, bg, bj, bd, bdh, bb, bbh, by, br, bl, bv, bhṇ, bhn, bhm, bhy, bhr, bhl, bhv, mṇ, mn, mp, mph, mb, mbh, mm, my, mr, ml, mv, yy, yv, rk, rk, hr, gr, gh, rc, rch, rj, rj, hr, ṭr, ḍr, ḍh, rṇ, rt, rth, rd, rdh, rn, rp, rph, rb, rbh, rm, ry, rl, rv, rś, rṣ, rs, rh, lk, lg, ld, lp, lph, lb, lbh, lm, ly, ll, lv, lś, lh, vṇ, vn, vy, vr, vl, śc, śch, śn, śp, śm, śy, śr, śl, śv, śś, ṣk, ṣkh, ṣṭ, ṣṭh, ṣṇ, ṣp, ṣph, ṣm, ṣy, ṣr, ṣv, ṣṣ, sk, skh, st, sth, sn, sp, sph, sm, sy, sr, sv, ss, hṇ, hn, hm, hy, hr, hl, hv

Посмотреть вложение 56036Посмотреть вложение 56037Посмотреть вложение 56038Посмотреть вложение 56039

Тут все-таки не http://semantic-evolution.narod.ru/Thesis2003_2_3_4.htm
 
У меня до скрупулезной обкатки дело не дошло: то автору не нужен указатель, то нужен, но не подробный... Скорее всего, вы будете первым. Кстати, автор скрипта большой энтузиаст скриптописания под Индизайн, поэтому если с ним обсудить какие-то тонкости, он может загореться и дописать код в целом, либо под вашу задачу.
 
Статус
Закрыто для дальнейших ответов.