[ID CC-CC2021] Выделение названия журнала в библиографических списках

Crosfield

Топикстартер
15 лет на форуме
Сообщения
13
Реакции
0
По требованиям редакции в пристатейных списках использованной литературы приходится отмечать курсивом названия журналов, книг и трудов конференций. Редакция использует не ГОСТ, а собственный стиль оформления. Например:

Супонина, А.Т., Петров, Б.А. (2021). Политическая мораль современной российской молодежи: ценности, представления, установки. Научный результат. Общество: политика, экономика, право, 3 (92), 19–22.
Шестопал, Е.Б., Рогач, Н.Н. (2020). Идеальные представления как фактор восприятия реального политического лидера. Полис. Политические исследования, 4, 166–180. DOI: 10.17976/jpps/2020.04.12

Статей много, списки литературы из 20-80 пунктов, большая часть из которых - статьи в журналах. Хочется автоматизировать этот процесс хотя бы для журнальных статей. На первый (мой) взгляд принцип прост - привязываемся к году в скобках и затем добираемся до названия журнала, который заканчивается запятой и через пробел - цифрой тома. Попытка написать что-то типа
(?:\(\d{4}\)\.\s.+?\.\s)(.+?)(?:\,\s\d) DEMO
приводит к выделению курсивом всего блока текста от первой скобки года до последней цифры, что наверное логично, но мне-то надо только название журнала, поэтому видимо нужны группы с ретроспективной и опережающей проверкой:
(?<=\(\d{4}\)\.\s.+?\.\s)(.+?)(?=\,\s\d)
Но тут получаем ошибку в +?, так как неизвестна длина фрагмента первой группы.

Но как-то же можно решить эту проблему? Буду благодарен за подсказку
 

Drawer

Участник
Сообщения
1 817
Реакции
799
Шестопал, Е.Б., Рогач, Н.Н. (2020). Идеальные представления как фактор восприятия реального политического лидера. Полис. Политические исследования, 4, 166–180. DOI: 10.17976/jpps/2020.04.12
Не уверен что верно понял задачу... так?
 

Crosfield

Топикстартер
15 лет на форуме
Сообщения
13
Реакции
0
Не уверен что верно понял задачу... так?
К сожалению нет, название журнала выделено курсивом в моем примере в первом посте. У Вас выделяется название статьи вместе с названием журнала
 

Drawer

Участник
Сообщения
1 817
Реакции
799

Drawer

Участник
Сообщения
1 817
Реакции
799
Беда :( С этими регулярками вечно "видит око, да зуб неймет"
Тут не в регулярке дело, а в том, что названия журналов ничем не отделены от названия статей. И прицепиться не к чему :( Разве что ...
1686261666551.png

ну и доработать GREP-ом :)
 
  • Спасибо
Реакции: ~RA~

Crosfield

Топикстартер
15 лет на форуме
Сообщения
13
Реакции
0
Названия журналов отделены, просто я не могу в InDesign вытащить группу (.+?) между двумя формально описанными ограничительными группами - их содержимое тоже включается в результат действия GREP-паттерна. Вот в Python могу обратиться к группе (.+?) отдельно, а тут - нет.
А идею, простите, не совсем понял. Зачем заключать весь текст в квадратные скобки? При необходимости можно же обратиться к началу и концу абзаца через ^ и $. Но как бы в данном случае это и не требуется. Но видимо идея в другом?
Я уже думал добраться к названию журнала с конца - с номеров страниц, но проблема в том что не часто, но и не редко указывается только номер первой страницы статьи и диапазона страниц "не случается"
 

Drawer

Участник
Сообщения
1 817
Реакции
799
А идею, простите, не совсем понял
Это не идея :) Это я ChatGPT напряг работой и заскринил результат.
Зачем заключать весь текст в квадратные скобки?
Он туповат и не отделит иначе текст запроса от обрабатываемого текста :)
Названия журналов отделены
Он названия статей? Как? не вижу...
 
Последнее редактирование:

Crosfield

Топикстартер
15 лет на форуме
Сообщения
13
Реакции
0
Это не идея :) Это я ChatGPT напряг работой и заскринил результат.

Он туповат и не отделит иначе текст запроса от обрабатываемого текста :)

Он названия статей? Как? не вижу...
Так в моем первом DEMO по первой регулярке в Group 1 как раз то, что нужно:
Screen Shot 2023-06-09 at 01.30.50.png
 

Crosfield

Топикстартер
15 лет на форуме
Сообщения
13
Реакции
0
Это не идея :) Это я ChatGPT напряг работой и заскринил результат.

Он туповат и не отделит иначе текст запроса от обрабатываемого текста :)

Он названия статей? Как? не вижу...
А за ChatGPT бааааальшое спасибо :) Вот когда будет в InDesign встроена, тогда еще возможно :)
 

Drawer

Участник
Сообщения
1 817
Реакции
799

Crosfield

Топикстартер
15 лет на форуме
Сообщения
13
Реакции
0
То есть Вы исходите из того, что в названии статьи может быть только одно предложение?:)
Согласен, еще надо допилить.... мммм... как-то... (чешу репу) '8] Просто два предложения в заголовках научных статей бывает очень не часто. Все равно глазами просматривать, а так хотя бы половину списка можно было бы "обустроить"... Ну ладно, пойду думать дальше... в любом случае спасибо за попытку помочь!:)
 

Drawer

Участник
Сообщения
1 817
Реакции
799
так хотя бы половину списка можно было бы "обустроить"
Ясно :) Не знаю можно ли это поиском-заменой, но GREP стилем вполне... Если что потом можно стиль грохнуть с сохранением форматирования...

Не по теме:
Хотя критерий "название статьи - одно предложение" так себе на мой взгляд :)
 

Вложения

  • GREP_style.zip
    1.3 МБ · Просм.: 87
  • Спасибо
Реакции: Crosfield

Crosfield

Топикстартер
15 лет на форуме
Сообщения
13
Реакции
0
Ясно :) Не знаю можно ли это поиском-заменой, но GREP стилем вполне... Если что потом можно стиль грохнуть с сохранением форматирования...

Не по теме:
Хотя критерий "название статьи - одно предложение" так себе на мой взгляд :)
О! Спасибо! Вы мой спаситель! И кажется я понял идею, попробую развить для транслитерированного варианта списка. Дело в том, что списков в статьях этой редакции два - Литература (пример из которого я выше привел), в котором русско- и англоязычные источники могут чередоваться, и References, в котором русскоязычные источники транслитерируются, плюс в квадратных скобках дается перевод на английский. И так как в References выделений курсивом получается два, всю работу над списками надо умножать на 3.

Не по теме:
Я понимаю, что критерий слабенький, но я уже этих статей за несколько лет заверстал сотню, просматривая все пристатейные списки литературы. Названия статей, состоящие более чем из одного предложения, действительно встречаются редко, но (вы правы) конечно встречаются. Вот названия журналов, разделяющиеся точкой/точками, встречаются во много раз чаще. Кроме того, просто просматривать списки, кое-где вмешиваясь - это одно, а другое - просматривать, выделять, жать Ctrl-I... и так again, and again, and again... в общем какое-то время такой хак все же сэкономит
 

Crosfield

Топикстартер
15 лет на форуме
Сообщения
13
Реакции
0
Ура, все получилось и с References! Хотя там было посложнее. Еще раз спасибо за ценную идею! :)