Выкрыжить статьи из PDF архива газеты

Статус
Закрыто для дальнейших ответов.

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 235
Реакции
10 852
Ответ: Выкрыжить статьи из PDF архива газеты

Неужели формат PDF настолько куцый, что в нём не сохраняется информация о story?
Нет, IMHO не сохраняется. Хотя, возможно, ID какую-то свою техническую инфу туда и прописывает, но навряд ли, лично я не встречал. Товарищ 1998 скажет вам точно, он тут главный гуру по PDF, правда, очень вспыльчивый. ;)
 

George

I wish I was a monster you think I am
15 лет на форуме
Сообщения
17 334
Реакции
7 873
Ответ: Выкрыжить статьи из PDF архива газеты

Есть волшебная программа Serif PagePlus X5(стоит копейки и решает Вашу задачу поудобней родного акробатовского сохранения в rtf, файнридера и т.д. То есть это редактор PDF.), удачи - http://www.pageplus.ru/pageplusx5.html
 

ruwiss

Участник
Топикстартер
Сообщения
20
Реакции
0
Ответ: Выкрыжить статьи из PDF архива газеты

Волшебной кнопки "в соответствующие папочки по статьям" — нету.
Нет слова "нету". :)
А кнопочку "сделать работу" мы ещё поищем!

Нет, IMHO не сохраняется. Хотя, возможно, ID какую-то свою техническую инфу туда и прописывает, но навряд ли, лично я не встречал. Товарищ 1998 скажет вам точно, он тут главный гуру по PDF, правда, очень вспыльчивый. ;)
Спасибо! Вспыльчивый, как видно, он тут не один, поэтому всё равно было бы интересно узнать его мнение!

Есть волшебная программа Serif PagePlus X5(стоит копейки и решает Вашу задачу поудобней родного акробатовского сохранения в rtf, файнридера и т.д. То есть это редактор PDF.), удачи - http://www.pageplus.ru/pageplusx5.html

Спасибо Вам, добрый человек. Обязательно попробую рекомендованную Вами программу!
 

Kiev_repro

12 лет на форуме
Сообщения
87
Реакции
20
Ответ: Выкрыжить статьи из PDF архива газеты

Попробовал вариант с Serif PagePlus X5 - неудобно. Да, редактирует хорошо, главное достоинство - сохранение стилей текста при редактировании. Потому, ruwiss, предлагаю как вариант такую связку. Из Акробата - Export all images (как раз складывать можно в отдельную папочку). Затем соорудить БД на MySQL или подобном, и наполнять руцями ячейки базы (заголовок -- подзаголовок-анонс-выноска -- основной текст -- иллюстрации). PagePlus-ом выдирается текст, имиджи в отдельных папках - дальше дело за движком сайта. Да, будет гемморно наполнить базу, но зато потом ни с оформлением, ни с изменениями стилей, ни с дальнейшей работой не будет траблов. ИМХО, где-то так.
Прикинул по времени - да, работки вагон. Пару недель на движок и отладку, а дальше - все в руках оператора. Понятно, что более 8000 А3 спусков за месяц не сделать, но, двоем-втроем за полгодика можно управиться... :)
 

George

I wish I was a monster you think I am
15 лет на форуме
Сообщения
17 334
Реакции
7 873

Kiev_repro

12 лет на форуме
Сообщения
87
Реакции
20
Ответ: Выкрыжить статьи из PDF архива газеты

Выложить на сайт пдф-ы и не выдумывать велосипед :)

Логичнее всего. Но, как я понял, задача стоит сделать что-то типа новостного портала на базе газеты, потому и понадобились исходники текстов и иллюстратива...
 

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 235
Реакции
10 852
Ответ: Выкрыжить статьи из PDF архива газеты

Да мало ли, может руководству нужно просто загрузить работника чем-нибудь на время новогоднего затишья, даже если это такой мартышкин труд, как переверстка из PDF в HTML многолетней подшивки газет. :D
Мне, вот, интересно - так что, Serif PagePlus все-таки статьи как-то вычленяет или все-таки только фреймы со стилем?
 

Любимцев

15 лет на форуме
Сообщения
4 225
Реакции
2 059
Ответ: Выкрыжить статьи из PDF архива газеты


Не по теме:
Serif PagePlus все-таки статьи как-то вычленяет …?
Я вам больше скажу — он их еще и редактирует, на лету, и за пивом бегает :)

 

Kiev_repro

12 лет на форуме
Сообщения
87
Реакции
20
Ответ: Выкрыжить статьи из PDF архива газеты

Мне, вот, интересно - так что, Serif PagePlus все-таки статьи как-то вычленяет или все-таки только фреймы со стилем?

Фреймы со стилями. Есть небольшой косяк с форматированием при наличии Substitute Fonts вместо embedded, но для данного случая - самое оно. Вот в экспорте пока не разобрался, может есть и еще что-то полезное (месяц назад впервые прогу увидел, пару часов всего поковыряться успел...)
 

_MBK_

Пикирующий бомбардировщик
15 лет на форуме
Сообщения
33 235
Реакции
10 852
Ответ: Выкрыжить статьи из PDF архива газеты

Тогда не пойму какой смысл в редактировании, если текст в соседний фрейм не перетекает? Просто слово поменять?
 

George

I wish I was a monster you think I am
15 лет на форуме
Сообщения
17 334
Реакции
7 873
Ответ: Выкрыжить статьи из PDF архива газеты

Serif PagePlus все-таки статьи как-то вычленяет или все-таки только фреймы со стилем?
Это программа вёрстки, и при это формат pdf для неё "почти родной". То есть это редактор pdf. Если все шрифты из старого pdf найти и чтобы они были в ОС, если подправить руками элементы заведомо глючащие при конвертации в html, то можно и сайт журнала не верстать, а сразу экспортировать pdf в html(в акробате Про тоже есть данная фишка, но проще сделать в пейджплюс). Видео на скорую руку(был открыт первый попавшийся pdf на винте, в видео видно, что таблица как таблица при конвертации в хтмл плохо выглядит, так как в пдф хоть и редактируема, но не таблица, а так процесс более скор, чем в других "редакторах" пдф):
 

Jeine

Да здравствует разум! Да сгинет маразм!
15 лет на форуме
Сообщения
7 343
Реакции
6 328
Ответ: Выкрыжить статьи из PDF архива газеты

Да уж! Автоматика и кибернетика!
Наверное после таких, извините за каламбур, акробатических номеров корректор обеспечен работой на несколько лет :)
 
Статус
Закрыто для дальнейших ответов.