[Acr DC] Извлечение из PDF страниц содержащих фразы из списка, заданного в текстовом файле и сохранение их в новый файл

Переделал на Edit
Если удобнее, можно и в экшн засунуть, назначить экшену выполнение скрипта и прописать там ExtractMatchingTheList() или ExtractMatchingTheListAdd() Тоже сработает по идее.
 

Вложения

Последнее редактирование:
@Drawer , увидел в меню и запустил. работает. Я так понимаю что скармливать список поиска нужно файлом с именем test.txt и именно в папке с открытым пдфом. Есть ли способ указывать на нужный файл со списком поиска или копи/паст список в какое то окошко?
 
нет, как я понимаю, в той же папке должен лежать файл с таким же именем, но с расширением .txt, оттуда и возьмет
JavaScript:
var re = /\.pdf$/i;
var filename = this.documentFileName.replace(re,"");
var datafilename = (filename+".txt");
 
Последнее редактирование:
  • Спасибо
Реакции: Drawer
Есть ли способ указывать на нужный файл со списком поиска
Ну, я просто хотел без интерфейса обойтись :) Но если списков для извлечения для одного файла может быть несколько, можно сделать интерфейс. Главное понять как тебе удобно будет.
 
нет, как я понимаю, в той же папке должен лежать файл с таким же именем, но с расширением .txt, оттуда и возьмет
JavaScript:
var re = /\.pdf$/i;
var filename = this.documentFileName.replace(re,"");
var datafilename = (filename+".txt");
В DC кстати засада с сохранением может быть... сейчас на домашнем он мне в папку Temp выходной файл пхнул :)
Тут исправил на абсолютный путь.
 

Вложения

Имхо, Ящик правильно сделал. Усложнение на первых этапах почти всегда неправильная стратегия.
А когда
списков бывает несколько
то их можно же объединить в один.
 
JavaScript:
or (var n = 0; n < findTextArr.length; n++) {
    for (var j = 0; j < textArray.length; j++)
        if (textArray[j].indexOf(findTextArr[n])>=0) {
            pagesArr.push(j)
            pagesArr.push(j+1)
        };
};
Вот это j+1 потенциально может выйти за количество страниц в файле
 
  • Спасибо
Реакции: Drawer
Еще вопрос... порядок страниц сохранять как в исходном файле или как в текстовом списке?
 
Последнее редактирование:
Еще вопрос... порядок страниц сохранять как в исходном файле или как в текстовом списке?
желательно т.к. список поиска чаще выглядит как "00001 00008 00025" и тд. (технический номер). но в архиве живой пример вёрстки заказчика (300 карточек) и то что в поиске это переделки (царапины и тд) и наш стандартный способ получить эти страницы тут не работает.
 

Вложения

прикрепил новый файлик для теста - скурвил евен стр что бы не попадали в поиск
 
Последнее редактирование:
Может удобнее будет сделать выбор только четные/нечетные/все ... ну или список?
хмммм... т.е. будет выбор? ну четные/нечетные особо смысла на данный момент не вижу а вот выбор "+ стр до найденой" и "+ стр после найденой" было бы круто.
 
Но чистое любопытство, зачем если это переделка царапин?
заходит тираж пластиковых карт или скрейтч, верстка заказчика (своя верстка не проблема с поиском и заменой т.к. делается через ексель), в процессе изготовления царапина/отслоение/и т.д. и нужно найти в пдфке эти страницы для переделок. а т.к. зачастую обороты у них разные то и обороты нужны тоже.
ЗЫ: и раз такое дело - есть возможность задавать место поиска медиа/блид/трим/арт боксом?
 
Последнее редактирование:
  • Спасибо
Реакции: Drawer