[Acr DC] Извлечение из PDF страниц содержащих фразы из списка, заданного в текстовом файле и сохранение их в новый файл

Drawer

Участник
Сообщения
2 098
Реакции
930

Drawer

Участник
Сообщения
2 098
Реакции
930
Переделал на Edit
Если удобнее, можно и в экшн засунуть, назначить экшену выполнение скрипта и прописать там ExtractMatchingTheList() или ExtractMatchingTheListAdd() Тоже сработает по идее.
 

Вложения

  • ExtractMatchingTheList.zip
    1 016 байт · Просм.: 14
Последнее редактирование:

duh

Топикстартер
20 лет на форуме
Сообщения
1 442
Реакции
701
@Drawer , увидел в меню и запустил. работает. Я так понимаю что скармливать список поиска нужно файлом с именем test.txt и именно в папке с открытым пдфом. Есть ли способ указывать на нужный файл со списком поиска или копи/паст список в какое то окошко?
 

zollinger

Участник
Сообщения
629
Реакции
195
нет, как я понимаю, в той же папке должен лежать файл с таким же именем, но с расширением .txt, оттуда и возьмет
JavaScript:
var re = /\.pdf$/i;
var filename = this.documentFileName.replace(re,"");
var datafilename = (filename+".txt");
 
Последнее редактирование:
  • Спасибо
Реакции: Drawer

Drawer

Участник
Сообщения
2 098
Реакции
930
Есть ли способ указывать на нужный файл со списком поиска
Ну, я просто хотел без интерфейса обойтись :) Но если списков для извлечения для одного файла может быть несколько, можно сделать интерфейс. Главное понять как тебе удобно будет.
 

duh

Топикстартер
20 лет на форуме
Сообщения
1 442
Реакции
701

Drawer

Участник
Сообщения
2 098
Реакции
930
нет, как я понимаю, в той же папке должен лежать файл с таким же именем, но с расширением .txt, оттуда и возьмет
JavaScript:
var re = /\.pdf$/i;
var filename = this.documentFileName.replace(re,"");
var datafilename = (filename+".txt");
В DC кстати засада с сохранением может быть... сейчас на домашнем он мне в папку Temp выходной файл пхнул :)
Тут исправил на абсолютный путь.
 

Вложения

  • ExtractMatchingTheList.zip
    1 010 байт · Просм.: 12

~RA~

Одарённая.
12 лет на форуме
Сообщения
12 213
Реакции
3 567
Имхо, Ящик правильно сделал. Усложнение на первых этапах почти всегда неправильная стратегия.
А когда
списков бывает несколько
то их можно же объединить в один.
 

Drawer

Участник
Сообщения
2 098
Реакции
930

zollinger

Участник
Сообщения
629
Реакции
195
JavaScript:
or (var n = 0; n < findTextArr.length; n++) {
    for (var j = 0; j < textArray.length; j++)
        if (textArray[j].indexOf(findTextArr[n])>=0) {
            pagesArr.push(j)
            pagesArr.push(j+1)
        };
};
Вот это j+1 потенциально может выйти за количество страниц в файле
 
  • Спасибо
Реакции: Drawer

Drawer

Участник
Сообщения
2 098
Реакции
930
Еще вопрос... порядок страниц сохранять как в исходном файле или как в текстовом списке?
 
Последнее редактирование:

duh

Топикстартер
20 лет на форуме
Сообщения
1 442
Реакции
701
Еще вопрос... порядок страниц сохранять как в исходном файле или как в текстовом списке?
желательно т.к. список поиска чаще выглядит как "00001 00008 00025" и тд. (технический номер). но в архиве живой пример вёрстки заказчика (300 карточек) и то что в поиске это переделки (царапины и тд) и наш стандартный способ получить эти страницы тут не работает.
 

Вложения

  • test_EvenPageCurve.pdf
    1.1 МБ · Просм.: 13

duh

Топикстартер
20 лет на форуме
Сообщения
1 442
Реакции
701
прикрепил новый файлик для теста - скурвил евен стр что бы не попадали в поиск
 

duh

Топикстартер
20 лет на форуме
Сообщения
1 442
Реакции
701
Последнее редактирование:

Drawer

Участник
Сообщения
2 098
Реакции
930

duh

Топикстартер
20 лет на форуме
Сообщения
1 442
Реакции
701
Может удобнее будет сделать выбор только четные/нечетные/все ... ну или список?
хмммм... т.е. будет выбор? ну четные/нечетные особо смысла на данный момент не вижу а вот выбор "+ стр до найденой" и "+ стр после найденой" было бы круто.
 

Drawer

Участник
Сообщения
2 098
Реакции
930

duh

Топикстартер
20 лет на форуме
Сообщения
1 442
Реакции
701
Но чистое любопытство, зачем если это переделка царапин?
заходит тираж пластиковых карт или скрейтч, верстка заказчика (своя верстка не проблема с поиском и заменой т.к. делается через ексель), в процессе изготовления царапина/отслоение/и т.д. и нужно найти в пдфке эти страницы для переделок. а т.к. зачастую обороты у них разные то и обороты нужны тоже.
ЗЫ: и раз такое дело - есть возможность задавать место поиска медиа/блид/трим/арт боксом?
 
Последнее редактирование:
  • Спасибо
Реакции: Drawer