[ID CC-CC2021] Как выделить все коды в каталоге?

Статус
Закрыто для дальнейших ответов.

MADMED

Участник
Топикстартер
Сообщения
4
Реакции
1
Добрый день, уважаемые форумчане!
Очень прошу помочь. Ситуация в следующем:
есть сверстанная книга - это каталог продукции, в котором для каждой позиции товара идет своя табличка с характеристиками, параметрами, размерами, и кодами продукта.
Нужно сделать в конце этой книги, в новом разделе, что-то вроде предметного указателя (справочника кодов) с указанием страничек на которых этот код встречается.
Я скачал скрипт IndexMatic, который проставляет номера страниц автоматически.
Вопрос: как задать чтобы он искал все коды, которые встречаются в каталоге?
Кода могут быть как в 3 символа (цифры + буквы), так и в 12 символов (цифры + буквы)
Пример кодов в картинке.
коды.jpg

т.е. должно получиться вот так:
3530110 34, 38
3530210 34, 38-40
...
3530415ZL 34, 74, 76

и т.д.


коды.jpg
 
Последнее редактирование модератором:

Linxy

Девушка с битой
10 лет на форуме
Сообщения
2 277
Реакции
3 836
Я не совсем знакома со скриптом IndexMatic, но предположу, что он умеет строить индекс на основе символьных стилей и задача сводится к их присвоению.
Основной вопрос. Таблиц много и они не связаны друг с другом, да?

Кода могут быть как в 3 символа (цыфры + буквы), так и в 12 символов (цыфры + буквы)
Этой информации маловато для построения хорошего запроса.
Желательно знать:
Сколько минимум цифр может идти сначала?
Код обязательно начинается с цифр?
Есть ли в тексте что-то кроме кодов, что тоже состоит из комбинации цифры + буквы.
 

MADMED

Участник
Топикстартер
Сообщения
4
Реакции
1
Я не совсем знакома со скриптом IndexMatic, но предположу, что он умеет строить индекс на основе символьных стилей и задача сводится к их присвоению.
Основной вопрос. Таблиц много и они не связаны друг с другом, да?


Этой информации маловато для построения хорошего запроса.
Желательно знать:
Сколько минимум цифр может идти сначала?
Код обязательно начинается с цифр?
Есть ли в тексте что-то кроме кодов, что тоже состоит из комбинации цифры + буквы.

Таблиц очень много, всего в книге порядка 900 страниц, на всех страницах присутствуют таблицы (может 10-20 страниц где их нет). Они не связаны между собой. Код не всегда начинается с цифры, самый минимальный состоит из 3-х символов, пример: 2В1, 2АА, 2G1. Буквы в кодах только заглавные (большие). Эти кода только в таблицах, в тексте их нет.
В тексте есть сочетание букв и цифр, пример: уровень защиты от IP44 до IP66/67. Но интересует, чтобы информация бралась только из таблиц.

На всякий случай ссылка на скрипт (делает индекс с указанием страниц автоматически, и сохраняет файл в текстовом формате):
Indiscripts :: IndexMatic | Stratégie d'indexation des noms propres
(внизу его можно скачать: Download IndexMaticTry.zip)
вот на него инструкция на англ. яз.:
http://www.indiscripts.com/blog/public/scripts/en_IndexMatic2-Manual.pdf
 

granat

Участник
Сообщения
382
Реакции
315
Если в таблицах использован оригинальный абзацный стиль для ячеек, то можно пройтись grep-поиском для применения кодам стиля символа (с указанием оригинального стиля абзаца). Проблемы могут возникнуть, если количество цифр кода совпадает с количеством цифр в колонках высота/длина/ширина (которые не должны войти в указатель).
 

MADMED

Участник
Топикстартер
Сообщения
4
Реакции
1
СПАСИБО ВСЕМ, КТО ПЫТАЛСЯ ПОМОЧЬ!

Как решал проблему:

Конечно не самый удобный способ, но как есть. Пришлось запрашивать список всех кодов у различных фирм.
Из этих списков в Екселе делалась так сказать единая база. Сортировалась по порядку, и исключались повторения.
Далее из формата ексель сохранял файл в текстовый формат с сохранением разбивки.
В индезайн был установлен скрипт: IndexBrutal_designtips_ru
При его запуске открывается окошко с просьбой указать путь к текстовому файлу.
Делаются установки (использовать активный документ или все открытые, каким знаком разделять номера страниц (указывал "," и "пробел").
Скрипт обрабатывает информацию, и в конце работы запрашивает место хранения нового тхт файла (с номерами страниц, где встречаются кода).
Но потом ручками приходилось удалять в тхт файле лишние номера страничек т.к. в тексте встречались наборы цифр, которые скрипт воспринял как коды.
Из-за большого количества данных, комп ОЧЕНЬ долго думает! Приходилось оставлять на ночь включенным.

PS: хотел выложить ссылку на сей скрипт, но форум ругается и не пропускает её. По этому, если кому-то понадобится файлик, пишите.
 

George

I wish I was a monster you think I am
15 лет на форуме
Сообщения
17 302
Реакции
7 864

MADMED

Участник
Топикстартер
Сообщения
4
Реакции
1
Вот ссылка на форумный файлообменник:
IndexBrutal_designtips_ru

IndexBrutal_designtips_ru

и
IndexMaticTry

отличаются принципами поиска информации, 2-й работает с ГРЕП-кодами или количеством заданных символов, 1-й - с тхт-файлами, в которых прописано что нужно искать
 
Статус
Закрыто для дальнейших ответов.