Конкорданс на основе содержимого определенного абзацного стиля

gasyoun · 19.07.2013

andrejK сказал(а):
создать папку Version 5.0

Сейчас у меня скрипт лежит в C:\Users\Lite\AppData\Roaming\Adobe\InDesign\Version 8.0\ru_RU\Scripts\Scripts Panel
Создать C:\Users\Lite\AppData\Roaming\Adobe\InDesign\Version 5.0 ? Или C:\Users\Lite\AppData\Roaming\Adobe\InDesign\Version 5.0\ru_RU\Scripts\Scripts Panel
Скопировал в C:\Users\Lite\AppData\Roaming\Adobe\InDesign\Version 5.0 - как его найти, как запустить-то теперь?

andrejK сказал(а):
4 пробела на табуляцию

И с табуляцией пробовал, и с пробелами (одинаковыми) - как закопанный. Упростил до:

Код:

adhiṣṭhāna 34
adhiṣṭhātar 65
adhvan 42
adhvan 96
adhyakṣa 73
adhyās 109
adhyātma 61

А все равно та же ошибка.

andrejK · 19.07.2013

C:\Users\user\AppData\Roaming\Adobe\InDesign\Version 8.0\en_US\Scripts\Scripts Panel\Version 5.0 Scripts

у меня лежит. и работает.

gasyoun · 19.07.2013

andrejK сказал(а):
Version 8.0\en_US\Scripts\Scripts Panel\Version 5.0 Scripts

Повторил трюк, не помогло. Можете, пожалуйста, на моем примере (выложен выше) запустить? У меня снова ругается.

andrejK · 19.07.2013

Всё работает. Проверяйте пути.

andrejK · 19.07.2013

у вас там в примере неверная сортировка.
типа 104 страница ранее страницы 20.

а всё работает. ищите где вы неправильно скрипт размещаете.

Skvoznyak · 19.07.2013

наверняка еще даже если сохранили в Version 5.0 Scripts запускаете не оттуда.

gasyoun · 19.07.2013

Skvoznyak сказал(а):
сохранили в Version 5.0 Scripts запускаете не оттуда

Так убил же и остальных мест, чтобы не путаться. На упрощенном примере тоже не хочет.

andrejK сказал(а):
всё работает

Присмотрелся я на Ваш скриншот и понял. Вы запускаете
http://forum.rudtp.ru/resources/alfavitnyj-ukazatel-sovmeschenie-odinakovyx-strok.74/ (сгенерированный скорее всего на его основе .jsbx на 11 кб, закрыт код)
а я
http://eugenyus.ucoz.ua/index/alfavitnyj_ukazatel_sovmeshhenie_odinakovykh_strok/0-32 (.jsx на 29 строк, 2 кб, открыт код)

Так вот .jsbx запустился сразу и начал свое грязное дело. Скрипт емо добавил пустых строк под и над разделительными буквами в начале нового "ряда", вот скрипт Евгения на них и ругается, сейчас в ручную убрал.

Код:

abhimāna    73
abhiprāya    79, 88
abhisaṃbuddha    42
abhitas    53, 88
abhitāpa    100

Теперь и у меня работает скрипт. То есть, возможно укозовский сайт заброшен, но форумное хранилище - актуальнее. Вместо 52 страниц получилось 38, но все еще много. Вместо 2 колонок разместил в 3, уже 27. Вопрос.

Код:

bhuvana    46, 46, 6
bhuvana    6

После второго (иднетичного первому слову) идет пробел. И его посчитали как другого. Нельзя ли пробелы урезать, или вылизивание и чистота файла - уже не дело скрипта? Или автозаменой убить все пустоты кроме табов и все. Заменил пустоты на пустоты и вместо 27 страниц уже 7 стр., больше похоже на правду. Вопрос.

Код:

praçaṅs    108
praçaṅs I P.    32
pratipad    73
pratipad IV    39, 97
pratipad IV Ā.    28

Разные слова записаны с разной степенью полноты. Насколько тяжело скрипт отучить смотреть все до таба, а смотреть только до первого пробела? В примере pratipad наглядный пример разной полноты записи одного и того же глагола. В 1-м случае записан как корень с приставкой, во втором добавлен класс глагола, в 3-м - еще и залог. Хотя речь об одном и том же.
Решением было бы унифицировать форму записи до обработки скриптом. Но есть проблема, которая возникает. Глаголы (внешне, то есть по буквам похожие), у которых отличается класс глагола. Нельзя ли их подружить?
Сейчас классы глаголов частично оторваны:

Код:

IV    105,105,108,110,14,26,35,35,36,36,36,49,50,50,51,55,56,58,59,68,70,70,73,76,80,83,85,85,88,89,93,94,95,96
IX    100,107,12,12,34,48,51,54,56,67,79,80,81,82,82,83,86,92,93

Хотя они и идут подряд, сразу после корней. Ну та вот - внизу привел пример, когда отличается класс корня, а корень (внешне) тот же. Нельзя подружить слегка разные слова? Точнее обладающие разными распространениями?

Код:

Было:
pratipad    73
pratipad IV    39, 97
pratipad VII Ā.    88
 
Стало:
pratipad IV - 39,73 97; VII Ā. - 88.

7x3.zip результат, до которого дошел.

gasyoun · 19.07.2013

Точнее не 7 а 18 страниц, почему-то появились при объединении (или проявились) пустые строки в единичном месте, убрал и еще текста прибавилось. devanagari-reader.zip - исходник. 18x3.zip - результат.

Чем ему

Код:

kar 69,79,83

не угодил не пойму, удалил его.

Запустил повторно скрипт после удаления "пробелов", вместо 18 уже 17 страниц.
Сейчас запятые идут без пробелов (хотя иногда попадаются).

Код:

kara    1,30,9
khalu    70,83, 40

Полноценный пробел займет много места, он не нужен. А какой-нибудь волясаной нельзя вставить автоматом, или опять же это я придираюсь?

gasyoun · 19.07.2013

Сложные случаи:

Код:

jita-indriya    77
jitendriya    77,77

Код:

kapota    67,74
kapotī,kapotikā    67

Мое видение разивитя скрипта, если Евгений любезно согласится его подкрутить, в двух направлениях насчет сопоставления не идентичных записей:
1) с расширителями после пробела
2) с размеченными внутри слова
Например, слово мужского рода kapota. Так как скрипт емо работает на основе символьного стиля, то вынести сюда и заглавное слово и его аббревиатуру не получается. То есть после каждого слова идет грамматическая пометка, в данном случае должна была бы стоять m. от masculinum, мужской код. На следующей строке идет kapotī, женский род. А потом идет слово женского рода (всего их две разновидности) уменшительным суффиксом -ка (лошадка, парнишка) и соеденительной гласной -i-, kapotikā. Нельзя ли так, чтобы я разметил тех, кого узнал как родственные души и чтобы они, как уже выше описивал насчет pratipad IV - 39,73 97; VII Ā. - 88.
То есть через точку с запятой разделать слегка разные, но все же близкие слова. В случае "голубя" kapota, получилось бы

Код:

kapota m. 77; f. kapotī 77,  f. kapotikā 77.
или
kapota m. 77; f. -ī 77,  f. -ikā 77.

Случай с голубем, насколько могу предположить, еще относительно простой. Хуже с вариациями внутри слова.
jitendriya = jita-indriya (слияние гласных внутри слов, правила сандхи, а+и=е)

Код:

jita-indriya    77
jitendriya    77,77

Их пометить, я так понимаю, уже на грани фантастики. То есть я то вручную все могу болдом или тэгом каким-то выделить, но чтобы скрипт их узнавал - тут, Евгений, наверное, пошлет меня куда подальше от Харькова

Eugenyus · 19.07.2013

Сайт не заброшен, это я почему-то не ту версию скрипта туда выложил (где откопал у себя ТАКУЮ древность — сам удивляюсь!), за сигнал спасибо, исправлю.

gasyoun сказал(а):
пошлет меня куда подальше от Харькова

Ну не то, чтобы...

Просто довольно трудоёмкая задача — учить железо интеллекту, распознаванию склонений, да ещё в незнакомом языке (если я правильно понял задачу).
Всё, чем могу помочь, — нарисовать висящую кнопку, по нажатию на которую происходила бы группировка выделенных строк (соседних, конечно) по заданному алгоритму. Но только во вторник, не раньше.

gasyoun · 19.07.2013

Eugenyus сказал(а):
откопал у себя ТАКУЮ древность

Но за то код open. Я за open source.

Спасибо, что влезли в драку.

Eugenyus сказал(а):
распознаванию склонений, да ещё в незнакомом языке

Это задача, над которой в санскрите одноврменно уже 15 лет работают 3 ученых с переменным успехом и лишь немец из Берлина продвнинулся сколько-то бы то не было. Но это явно не в рамках индизайна, увы. Там тяжелый отдельный софт нужен и устройство алгоритма мне не ведомо.
Я имел ввиду, что я руками прописиваю окончания, то есть выделяю их форматированием, а потом мы их склеивам с выщестоящим членом (у которого окончание тоже помечено).

Eugenyus сказал(а):
кнопка - группировка выделенных строк (соседних, конечно) по заданному алгоритму

Емко. Да, было, например, "kapota m. 77; f. kapotī 77, f. kapotikā 77."
Я прошел болдом сделал "kapota m. 77; f. kapotī 77, f. kapotikā 77." При этом общяя часть между ними "kapot" и она идет первая, над всеми остальными в списке. Можем ли получить "kapota m. 77; f. -ī 77, f. -ikā 77."? Я Вас правильно понял, или Вы склоняется к "kapota m. 77; f. kapotī 77, f. kapotikā 77." как вверху совершенства уже?

Eugenyus · 19.07.2013

Именно с этим примером справился вот такой запрос:

Причём безо всяких символьных стилей.
Так что не "склоняется" я к тому, что Вы написали, как к верху совершенства)).

gasyoun · 19.07.2013

Eugenyus сказал(а):
справился вот такой запрос

Ой, ой - а скопируйте, пожалуйста, сюда, что на что меняем.

Да и пока они у нас в формате:

kapota 67,74
kapotī,kapotikā 67

А:

kapota m. 77; f. kapotī 77, f. kapotikā 77.

Это уже пожелание к скриптингу.
А:

kapota m. 77; f. -ī 77, f. -ikā 77.

Уже мечти

Eugenyus · 19.07.2013

gasyoun сказал(а):
скопируйте, пожалуйста, сюда,

В запросе семь скобок. Их содержимое распределится так:
(kapot)(a m. )(77; f. )(kapot)(ī 77, f. )(kapot)(ikā 77)
По замене вместо четвёртой и шестой скобок ставятся дефисы, остальное содержимое остаётся без изменений.

Поиск

Конкорданс на основе содержимого определенного абзацного стиля

gasyoun

Санскритятина

andrejK

gasyoun

Санскритятина

andrejK

andrejK

Skvoznyak

gasyoun

Санскритятина

Вложения

gasyoun

Санскритятина

Вложения

gasyoun

Санскритятина

Вложения

Eugenyus

gasyoun

Санскритятина

Eugenyus

gasyoun

Санскритятина

Вложения

Eugenyus