[CC] Как выделить все коды в каталоге?

Тема в разделе "GREP и поиск/замена", создана пользователем MADMED, 19 мар 2017.

  1. Добрый день, уважаемые форумчане!
    Очень прошу помочь. Ситуация в следующем:
    есть сверстанная книга - это каталог продукции, в котором для каждой позиции товара идет своя табличка с характеристиками, параметрами, размерами, и кодами продукта.
    Нужно сделать в конце этой книги, в новом разделе, что-то вроде предметного указателя (справочника кодов) с указанием страничек на которых этот код встречается.
    Я скачал скрипт IndexMatic, который проставляет номера страниц автоматически.
    Вопрос: как задать чтобы он искал все коды, которые встречаются в каталоге?
    Кода могут быть как в 3 символа (цифры + буквы), так и в 12 символов (цифры + буквы)
    Пример кодов в картинке.
    коды.jpg

    т.е. должно получиться вот так:
    3530110 34, 38
    3530210 34, 38-40
    ...
    3530415ZL 34, 74, 76

    и т.д.


    коды.jpg
     
    #1 MADMED, 19 мар 2017
    Последнее редактирование модератором: 19 мар 2017
  2. Я не совсем знакома со скриптом IndexMatic, но предположу, что он умеет строить индекс на основе символьных стилей и задача сводится к их присвоению.
    Основной вопрос. Таблиц много и они не связаны друг с другом, да?

    Этой информации маловато для построения хорошего запроса.
    Желательно знать:
    Сколько минимум цифр может идти сначала?
    Код обязательно начинается с цифр?
    Есть ли в тексте что-то кроме кодов, что тоже состоит из комбинации цифры + буквы.
     
  3. Таблиц очень много, всего в книге порядка 900 страниц, на всех страницах присутствуют таблицы (может 10-20 страниц где их нет). Они не связаны между собой. Код не всегда начинается с цифры, самый минимальный состоит из 3-х символов, пример: 2В1, 2АА, 2G1. Буквы в кодах только заглавные (большие). Эти кода только в таблицах, в тексте их нет.
    В тексте есть сочетание букв и цифр, пример: уровень защиты от IP44 до IP66/67. Но интересует, чтобы информация бралась только из таблиц.

    На всякий случай ссылка на скрипт (делает индекс с указанием страниц автоматически, и сохраняет файл в текстовом формате):
    Indiscripts :: IndexMatic | Stratégie d'indexation des noms propres
    (внизу его можно скачать: Download IndexMaticTry.zip)
    вот на него инструкция на англ. яз.:
    http://www.indiscripts.com/blog/public/scripts/en_IndexMatic2-Manual.pdf
     
  4. Если в таблицах использован оригинальный абзацный стиль для ячеек, то можно пройтись grep-поиском для применения кодам стиля символа (с указанием оригинального стиля абзаца). Проблемы могут возникнуть, если количество цифр кода совпадает с количеством цифр в колонках высота/длина/ширина (которые не должны войти в указатель).
     
  5. СПАСИБО ВСЕМ, КТО ПЫТАЛСЯ ПОМОЧЬ!

    Как решал проблему:

    Конечно не самый удобный способ, но как есть. Пришлось запрашивать список всех кодов у различных фирм.
    Из этих списков в Екселе делалась так сказать единая база. Сортировалась по порядку, и исключались повторения.
    Далее из формата ексель сохранял файл в текстовый формат с сохранением разбивки.
    В индезайн был установлен скрипт: IndexBrutal_designtips_ru
    При его запуске открывается окошко с просьбой указать путь к текстовому файлу.
    Делаются установки (использовать активный документ или все открытые, каким знаком разделять номера страниц (указывал "," и "пробел").
    Скрипт обрабатывает информацию, и в конце работы запрашивает место хранения нового тхт файла (с номерами страниц, где встречаются кода).
    Но потом ручками приходилось удалять в тхт файле лишние номера страничек т.к. в тексте встречались наборы цифр, которые скрипт воспринял как коды.
    Из-за большого количества данных, комп ОЧЕНЬ долго думает! Приходилось оставлять на ночь включенным.

    PS: хотел выложить ссылку на сей скрипт, но форум ругается и не пропускает её. По этому, если кому-то понадобится файлик, пишите.
     
  6. Зазипуйте и не ссылкой, а через форумный файлообменник.
     
  7. Он чем-то от этого отличается?
    Indiscripts :: Indiscripts Temporary Archives
     
  8. Вот ссылка на форумный файлообменник:
    IndexBrutal_designtips_ru

    IndexBrutal_designtips_ru

    и
    IndexMaticTry

    отличаются принципами поиска информации, 2-й работает с ГРЕП-кодами или количеством заданных символов, 1-й - с тхт-файлами, в которых прописано что нужно искать
     
  9. И исходная версия старее, 2.1, у автора 2.1b
     
  10. Если это мне, то я не об этом спрашивал, ответ уже нашел, см. выше.
     

Поделиться этой страницей

   Рейтинг@Mail.ru