[Acr DC] Извлечение из PDF страниц содержащих фразы из списка, заданного в текстовом файле и сохранение их в новый файл

Drawer · 08.08.2024

_MBK_ сказал(а):
Я ж надеюсь у тебя не Reader?

Может в DC нет Tools? Щас гляну...

Drawer сказал(а):
поиск по целому слову

Сорян, не слову, фразе... find text тоже найдет

Drawer · 08.08.2024

Drawer сказал(а):
в DC нет Tools

Переделал на Edit
Если удобнее, можно и в экшн засунуть, назначить экшену выполнение скрипта и прописать там ExtractMatchingTheList() или ExtractMatchingTheListAdd() Тоже сработает по идее.

duh · 08.08.2024

@Drawer , увидел в меню и запустил. работает. Я так понимаю что скармливать список поиска нужно файлом с именем test.txt и именно в папке с открытым пдфом. Есть ли способ указывать на нужный файл со списком поиска или копи/паст список в какое то окошко?

zollinger · 08.08.2024

нет, как я понимаю, в той же папке должен лежать файл с таким же именем, но с расширением .txt, оттуда и возьмет

JavaScript:

var re = /\.pdf$/i;
var filename = this.documentFileName.replace(re,"");
var datafilename = (filename+".txt");

Drawer · 08.08.2024

duh сказал(а):
Есть ли способ указывать на нужный файл со списком поиска

Ну, я просто хотел без интерфейса обойтись

Но если списков для извлечения для одного файла может быть несколько, можно сделать интерфейс. Главное понять как тебе удобно будет.

duh · 08.08.2024

Drawer сказал(а):
Главное понять как тебе удобно будет.

duh сказал(а):
указывать на нужный файл со списком поиска или копи/паст список в какое то окошко?

и да списков бывает несколько.

Drawer · 08.08.2024

zollinger сказал(а):
нет, как я понимаю, в той же папке должен лежать файл с таким же именем, но с расширением .txt, оттуда и возьмет

JavaScript:

var re = /\.pdf$/i; var filename = this.documentFileName.replace(re,""); var datafilename = (filename+".txt");

В DC кстати засада с сохранением может быть... сейчас на домашнем он мне в папку Temp выходной файл пхнул

Тут исправил на абсолютный путь.

~RA~ · 08.08.2024

Имхо, Ящик правильно сделал. Усложнение на первых этапах почти всегда неправильная стратегия.
А когда

duh сказал(а):
списков бывает несколько

то их можно же объединить в один.

Drawer · 08.08.2024

duh сказал(а):
и да списков бывает несколько

Ок, можно окно выбора файла. Какое имя для сохранения? Всегда одно или добавлять имя текстового файла... или как?

zollinger · 08.08.2024

JavaScript:

or (var n = 0; n < findTextArr.length; n++) {
    for (var j = 0; j < textArray.length; j++)
        if (textArray[j].indexOf(findTextArr[n])>=0) {
            pagesArr.push(j)
            pagesArr.push(j+1)
        };
};

Вот это j+1 потенциально может выйти за количество страниц в файле

Drawer · 08.08.2024

zollinger сказал(а):
Вот это j+1

Угу, надо переделать.

Drawer · 08.08.2024

Еще вопрос... порядок страниц сохранять как в исходном файле или как в текстовом списке?

duh · 08.08.2024

Drawer сказал(а):
Еще вопрос... порядок страниц сохранять как в исходном файле или как в текстовом списке?

желательно т.к. список поиска чаще выглядит как "00001 00008 00025" и тд. (технический номер). но в архиве живой пример вёрстки заказчика (300 карточек) и то что в поиске это переделки (царапины и тд) и наш стандартный способ получить эти страницы тут не работает.

duh · 08.08.2024

прикрепил новый файлик для теста - скурвил евен стр что бы не попадали в поиск

Drawer · 08.08.2024

duh сказал(а):
желательно

Порядок как в исходном я верно понял?

duh · 08.08.2024

Drawer сказал(а):
Порядок как в исходном я верно понял?

таки да (в *.txt списке замен)

Drawer · 08.08.2024

duh сказал(а):
скурвил евен стр

Может удобнее будет сделать выбор только четные/нечетные/все ... ну или список?

duh · 08.08.2024

Drawer сказал(а):
Может удобнее будет сделать выбор только четные/нечетные/все ... ну или список?

хмммм... т.е. будет выбор? ну четные/нечетные особо смысла на данный момент не вижу а вот выбор "+ стр до найденой" и "+ стр после найденой" было бы круто.

Drawer · 08.08.2024

duh сказал(а):
выбор "+ стр до найденой" и "+ стр после найденой"

Можно, раз уж делать интерфейс... Но чистое любопытство, зачем если это переделка царапин?

duh · 08.08.2024

Drawer сказал(а):
Но чистое любопытство, зачем если это переделка царапин?

заходит тираж пластиковых карт или скрейтч, верстка заказчика (своя верстка не проблема с поиском и заменой т.к. делается через ексель), в процессе изготовления царапина/отслоение/и т.д. и нужно найти в пдфке эти страницы для переделок. а т.к. зачастую обороты у них разные то и обороты нужны тоже.
ЗЫ: и раз такое дело - есть возможность задавать место поиска медиа/блид/трим/арт боксом?

Поиск

[Acr DC] Извлечение из PDF страниц содержащих фразы из списка, заданного в текстовом файле и сохранение их в новый файл

Drawer

Участник

Drawer

Участник

Вложения

duh

zollinger

Не человек. Золото

Drawer

Участник

duh

Drawer

Участник

Вложения

~RA~

🄯

Drawer

Участник

zollinger

Не человек. Золото

Drawer

Участник

Drawer

Участник

duh

Вложения

duh

Drawer

Участник

duh

Drawer

Участник

duh

Drawer

Участник

duh