Конкорданс на основе содержимого определенного абзацного стиля

  • Автор темы Автор темы gasyoun
  • Дата начала Дата начала
Статус
Закрыто для дальнейших ответов.
создать папку Version 5.0
Сейчас у меня скрипт лежит в C:\Users\Lite\AppData\Roaming\Adobe\InDesign\Version 8.0\ru_RU\Scripts\Scripts Panel
Создать C:\Users\Lite\AppData\Roaming\Adobe\InDesign\Version 5.0 ? Или C:\Users\Lite\AppData\Roaming\Adobe\InDesign\Version 5.0\ru_RU\Scripts\Scripts Panel
Скопировал в C:\Users\Lite\AppData\Roaming\Adobe\InDesign\Version 5.0 - как его найти, как запустить-то теперь?


4 пробела на табуляцию
И с табуляцией пробовал, и с пробелами (одинаковыми) - как закопанный. Упростил до:
Код:
adhiṣṭhāna 34
adhiṣṭhātar 65
adhvan 42
adhvan 96
adhyakṣa 73
adhyās 109
adhyātma 61
А все равно та же ошибка.
 
C:\Users\user\AppData\Roaming\Adobe\InDesign\Version 8.0\en_US\Scripts\Scripts Panel\Version 5.0 Scripts

у меня лежит. и работает.
 
Всё работает. Проверяйте пути.

Eugenius.jpg
 
у вас там в примере неверная сортировка.
типа 104 страница ранее страницы 20.

а всё работает. ищите где вы неправильно скрипт размещаете.
 
наверняка еще даже если сохранили в Version 5.0 Scripts запускаете не оттуда.
 
сохранили в Version 5.0 Scripts запускаете не оттуда
Так убил же и остальных мест, чтобы не путаться. На упрощенном примере тоже не хочет.

Присмотрелся я на Ваш скриншот и понял. Вы запускаете
http://forum.rudtp.ru/resources/alfavitnyj-ukazatel-sovmeschenie-odinakovyx-strok.74/ (сгенерированный скорее всего на его основе .jsbx на 11 кб, закрыт код)
а я
http://eugenyus.ucoz.ua/index/alfavitnyj_ukazatel_sovmeshhenie_odinakovykh_strok/0-32 (.jsx на 29 строк, 2 кб, открыт код)

Так вот .jsbx запустился сразу и начал свое грязное дело. Скрипт емо добавил пустых строк под и над разделительными буквами в начале нового "ряда", вот скрипт Евгения на них и ругается, сейчас в ручную убрал.

Код:
abhimāna    73
abhiprāya    79, 88
abhisaṃbuddha    42
abhitas    53, 88
abhitāpa    100

Теперь и у меня работает скрипт. То есть, возможно укозовский сайт заброшен, но форумное хранилище - актуальнее. Вместо 52 страниц получилось 38, но все еще много. Вместо 2 колонок разместил в 3, уже 27. Вопрос.
Код:
bhuvana    46, 46, 6
bhuvana    6
После второго (иднетичного первому слову) идет пробел. И его посчитали как другого. Нельзя ли пробелы урезать, или вылизивание и чистота файла - уже не дело скрипта? Или автозаменой убить все пустоты кроме табов и все. Заменил пустоты на пустоты и вместо 27 страниц уже 7 стр., больше похоже на правду. Вопрос.
Код:
praçaṅs    108
praçaṅs I P.    32
pratipad    73
pratipad IV    39, 97
pratipad IV Ā.    28
Разные слова записаны с разной степенью полноты. Насколько тяжело скрипт отучить смотреть все до таба, а смотреть только до первого пробела? В примере pratipad наглядный пример разной полноты записи одного и того же глагола. В 1-м случае записан как корень с приставкой, во втором добавлен класс глагола, в 3-м - еще и залог. Хотя речь об одном и том же.
Решением было бы унифицировать форму записи до обработки скриптом. Но есть проблема, которая возникает. Глаголы (внешне, то есть по буквам похожие), у которых отличается класс глагола. Нельзя ли их подружить?
Сейчас классы глаголов частично оторваны:
Код:
IV    105,105,108,110,14,26,35,35,36,36,36,49,50,50,51,55,56,58,59,68,70,70,73,76,80,83,85,85,88,89,93,94,95,96
IX    100,107,12,12,34,48,51,54,56,67,79,80,81,82,82,83,86,92,93

Хотя они и идут подряд, сразу после корней. Ну та вот - внизу привел пример, когда отличается класс корня, а корень (внешне) тот же. Нельзя подружить слегка разные слова? Точнее обладающие разными распространениями?

Код:
Было:
pratipad    73
pratipad IV    39, 97
pratipad VII Ā.    88
 
Стало:
pratipad IV - 39,73 97; VII Ā. - 88.

7x3.zip результат, до которого дошел.
 

Вложения

  • alfavitniy.jpg
    alfavitniy.jpg
    37.9 КБ · Просм.: 767
  • borba-s-pustotoy.jpg
    borba-s-pustotoy.jpg
    57.7 КБ · Просм.: 961
  • 1661.jpg
    1661.jpg
    16.9 КБ · Просм.: 1 029
Точнее не 7 а 18 страниц, почему-то появились при объединении (или проявились) пустые строки в единичном месте, убрал и еще текста прибавилось. devanagari-reader.zip - исходник. 18x3.zip - результат.

Чем ему
Код:
kar 69,79,83
не угодил не пойму, удалил его.

Запустил повторно скрипт после удаления "пробелов", вместо 18 уже 17 страниц.
Сейчас запятые идут без пробелов (хотя иногда попадаются).
Код:
kara    1,30,9
khalu    70,83, 40
Полноценный пробел займет много места, он не нужен. А какой-нибудь волясаной нельзя вставить автоматом, или опять же это я придираюсь?
 

Вложения

Сложные случаи:
Код:
jita-indriya    77
jitendriya    77,77

Код:
kapota    67,74
kapotī,kapotikā    67

Мое видение разивитя скрипта, если Евгений любезно согласится его подкрутить, в двух направлениях насчет сопоставления не идентичных записей:
1) с расширителями после пробела
2) с размеченными внутри слова
Например, слово мужского рода kapota. Так как скрипт емо работает на основе символьного стиля, то вынести сюда и заглавное слово и его аббревиатуру не получается. То есть после каждого слова идет грамматическая пометка, в данном случае должна была бы стоять m. от masculinum, мужской код. На следующей строке идет kapotī, женский род. А потом идет слово женского рода (всего их две разновидности) уменшительным суффиксом -ка (лошадка, парнишка) и соеденительной гласной -i-, kapotikā. Нельзя ли так, чтобы я разметил тех, кого узнал как родственные души и чтобы они, как уже выше описивал насчет pratipad IV - 39,73 97; VII Ā. - 88.
То есть через точку с запятой разделать слегка разные, но все же близкие слова. В случае "голубя" kapota, получилось бы
Код:
kapota m. 77; f. kapotī 77,  f. kapotikā 77.
или
kapota m. 77; f. -ī 77,  f. -ikā 77.
Случай с голубем, насколько могу предположить, еще относительно простой. Хуже с вариациями внутри слова.
jitendriya = jita-indriya (слияние гласных внутри слов, правила сандхи, а+и=е)
Код:
jita-indriya    77
jitendriya    77,77
Их пометить, я так понимаю, уже на грани фантастики. То есть я то вручную все могу болдом или тэгом каким-то выделить, но чтобы скрипт их узнавал - тут, Евгений, наверное, пошлет меня куда подальше от Харькова :)
 

Вложения

  • lepota.jpg
    lepota.jpg
    211.5 КБ · Просм.: 1 008
Сайт не заброшен, это я почему-то не ту версию скрипта туда выложил (где откопал у себя ТАКУЮ древность — сам удивляюсь!), за сигнал спасибо, исправлю.
пошлет меня куда подальше от Харькова
Ну не то, чтобы...:) Просто довольно трудоёмкая задача — учить железо интеллекту, распознаванию склонений, да ещё в незнакомом языке (если я правильно понял задачу).
Всё, чем могу помочь, — нарисовать висящую кнопку, по нажатию на которую происходила бы группировка выделенных строк (соседних, конечно) по заданному алгоритму. Но только во вторник, не раньше.
 
  • Спасибо
Реакции: gasyoun
откопал у себя ТАКУЮ древность
Но за то код open. Я за open source.

Спасибо, что влезли в драку.

распознаванию склонений, да ещё в незнакомом языке
Это задача, над которой в санскрите одноврменно уже 15 лет работают 3 ученых с переменным успехом и лишь немец из Берлина продвнинулся сколько-то бы то не было. Но это явно не в рамках индизайна, увы. Там тяжелый отдельный софт нужен и устройство алгоритма мне не ведомо.
Я имел ввиду, что я руками прописиваю окончания, то есть выделяю их форматированием, а потом мы их склеивам с выщестоящим членом (у которого окончание тоже помечено).

кнопка - группировка выделенных строк (соседних, конечно) по заданному алгоритму

Емко. Да, было, например, "kapota m. 77; f. kapotī 77, f. kapotikā 77."
Я прошел болдом сделал "kapota m. 77; f. kapotī 77, f. kapotikā 77." При этом общяя часть между ними "kapot" и она идет первая, над всеми остальными в списке. Можем ли получить "kapota m. 77; f. -ī 77, f. -ikā 77."? Я Вас правильно понял, или Вы склоняется к "kapota m. 77; f. kapotī 77, f. kapotikā 77." как вверху совершенства уже?
 
Именно с этим примером справился вот такой запрос:
sanscr.jpg
Причём безо всяких символьных стилей.
Так что не "склоняется" я к тому, что Вы написали, как к верху совершенства)).
 
справился вот такой запрос
Ой, ой - а скопируйте, пожалуйста, сюда, что на что меняем.

Да и пока они у нас в формате:
  • kapota 67,74
  • kapotī,kapotikā 67
А:
  • kapota m. 77; f. kapotī 77, f. kapotikā 77.
Это уже пожелание к скриптингу.
А:
  • kapota m. 77; f. -ī 77, f. -ikā 77.
Уже мечти :)
 

Вложения

скопируйте, пожалуйста, сюда,
В запросе семь скобок. Их содержимое распределится так:
(kapot)(a m. )(77; f. )(kapot)(ī 77, f. )(kapot)(ikā 77)
По замене вместо четвёртой и шестой скобок ставятся дефисы, остальное содержимое остаётся без изменений.
 
Статус
Закрыто для дальнейших ответов.