[ID CC-CC2022] Найти второе слово в абзаце оканчивающееся на "а"

Slx1 · 12.12.2019

Господа, помогите плиз сГРЕПом
Спасибо заранее!

LeonidB · 12.12.2019

Проверяйте:

Код:

((^.+?а\b)(\w+|\h|[[:punct:]])+?)\K\b\w+а\b

Не по теме:
К сожалению, только такого монстра придумал

kuplumosk · 12.12.2019

LeonidB сказал(а):
Проверяйте:

Код:

((^.+?а\b)(\w+|\h|[[:punct:]])+?)\K\b\w+а\b

Не по теме:
К сожалению, только такого монстра придумал

А можно расшифровать как он ищет? )

LeonidB · 12.12.2019

kuplumosk сказал(а):
А можно расшифровать как он ищет? )

Вах! Я чуть не ~~сдох~~ погиб смертию храбрых, придумывая этот ужас, а тут ещё и объяснять? '))'

1. В конце стоит \b\w+а\b - это слово, заканчивающееся на "а" (можно, наверно, было бы и \b\w*а\b - тогда бы и однобуквенные союзы "а" тоже вошли бы в поиск, если нужно).
2. \K - это положительный поиск назад (аналог (?<=__), который не всегда срабатывает.
3. Выражение ((^.+?а\b)(\w+|\h|[[ :4)

unct:]])+?) перед \K - это:
- (^.+?а\b) - любое выражение минимальной длины от начала абзаца до слова, заканчивающегося на "а", после которого стоит (\w+|\h|[[:рunct:]])+?) - то есть либо слово \w+ либо любой пробел \h, либо пунктуация, либо сочетание таковых.

Linxy · 12.12.2019

Slx1 сказал(а):
Господа, помогите плиз сГРЕПом
Спасибо заранее!

А что Вы дальше планируете делать с этим словом?
От этого порой зависит подход к решению задачи, поэтому лучше сразу обозначать цели.

LeonidB сказал(а):
Проверяйте:

Код:

((^.+?а\b)(\w+|\h|[[:punct:]])+?)\K\b\w+а\b

Не по теме:
К сожалению, только такого монстра придумал

У меня чуть короче получилось, но не уверена, что я учла все возможные варианты:
\r?^(\w+[[:punct:]]? )\K\w+а

В этом вопросе засада таится в стандартных ограничениях positive lookbehind. Это выражение не поддерживает повторение символов, что в целом разумно.
Поэтому выкрутиться можно через другое выражение:
\K
Всё, что находится до него будет использоваться для поиска совпадения, но не будет учитываться в найденном. Грубо говоря, это другая версия просмотра вперёд.

Linxy · 12.12.2019

@LeonidB, Лёня, лучше использовать теги для кода, а то у тебя теперь греп-выражения дразнятся))))

А зачем ты одновременно указываешь и \w, и \b?

LeonidB · 12.12.2019

Linxy сказал(а):
@LeonidB, Лёня, лучше использовать теги для кода, а то у тебя теперь греп-выражения дразнятся))))

Я там уже на русскую букву "р" заменил, что, конечно, может ввести в конфуз '))'

Но, надеюсь, оттуда копировать выражение не будут.
Лишние абзацы в своём тексте просто делать не хотел, а тут такая подлянка со стороны движка

Linxy сказал(а):
А зачем ты одновременно указываешь и \w, и \b?

Согласен, в конце можно и так:

Код:

\K\w+а\b

Linxy · 12.12.2019

Linxy сказал(а):
У меня чуть короче получилось, но не уверена, что я учла все возможные варианты:

Да, не учла слова через дефис. Тогда вообще можно вот так сделать:
\r?^(\b.+? )\K\w+а

LeonidB · 12.12.2019

Linxy сказал(а):
Поэтому выкрутиться можно через другое выражение:
/K

\K

LeonidB · 12.12.2019

Linxy сказал(а):
Да, не учла слова через дефис. Тогда вообще можно вот так сделать:
\r?^(\b.+? )\K\w+а

Ань, у меня 1-е слово с "а" на конце этим поиском ищется.

Linxy · 12.12.2019

LeonidB сказал(а):
Ань, у меня 1-е слово с "а" на конце этим поиском ищется.

Хммм, странно. У меня второе.

Где же у нас расхождение?

Linxy · 12.12.2019

LeonidB сказал(а):
Согласен, в конце можно и так:

Код:

\K\w+а\b

А в конце зачем \b?
Интерес не праздный, пытаюсь понять, даёт ли это дополнительные гарантии и стоит ли так перестраховываться.

Linxy · 12.12.2019

Linxy сказал(а):
Где же у нас расхождение?

Ааа, я поняла. По-разному прочитали запрос ТС.
Я вижу так, что надо искать просто второе слово в абзаце и выделять его только в случае, если оно заканчивается на «а».
У тебя подход, что мы ищем только слова, заканчивающиеся на букву «а» и среди них второе слово.

LeonidB · 12.12.2019

Linxy сказал(а):
Хммм, странно. У меня второе. Где же у нас расхождение?

Какой-то глюк у меня. Сейчас нормально.

LeonidB · 12.12.2019

Linxy сказал(а):
У тебя подход, что мы ищем только слова, заканчивающиеся на букву «а» и среди них второе слово.

Да.

Linxy · 12.12.2019

LeonidB сказал(а):
Да.

Тогда так:
\r?^(\b.+?а\b[[:punct:]]? )\K\b.+?а\b
В целом тоже, что и у тебя выше, я уже просто упражняюсь для спортивного интереса.

Вообще редко использую \w, мне привычнее ограничивать рамками границ слова — \b. Вот и пытаюсь понять, в каких случаях правильнее использовать \w.

И в этот раз не уверена, что именно нужно ТС. Тот случай, когда краткость ~~вопроса~~ не всегда сестра таланту.

lev · 12.12.2019

Мой вариант
^\S+\s+\K\S+а(?=\s)
Пытался учесть дефис во втором слове после буквы "а", типа "абра-кадабра, кадабра-абра сим-селабим"
А слеш отлавливать не стал - "Здрасте, г-н/г-жа Вставить имя", будет выделено как целое слово, вряд ли у ТС такое есть.

iv-mi · 12.12.2019

Можно сделать обобщенный запрос
(?m)^([\S\h]+?а\b){2}\K[\S\h]+?\K\b[-\w]+а\b
тут в фигурных скобках сколько слов, кончающихся буквой а надо пропустить, прежде чем выделить такое слово.

LeonidB · 12.12.2019

Не по теме:
О, какие маститые греповодники в эту тему набежали

iv-mi · 12.12.2019

Да ладно, "маститые"...

Я там ещё и накосячил
вместо
(?m)^([\S\h]+?а\b){2}\K[\S\h]+?\K\b[-\w]+а\b
надо
(?m)^(.+?а\b){2}\K.+?\K\b[-\w]+а\b
Интересно, что тут в одном запросе подряд два одинаковых варианта просмотра: \K дважды используется.
Это не часто встречается.

Поиск

[ID CC-CC2022] Найти второе слово в абзаце оканчивающееся на "а"

Slx1

LeonidB

Их бин

kuplumosk

Участник

LeonidB

Их бин

Linxy

Девушка с битой

Linxy

Девушка с битой

LeonidB

Их бин

Linxy

Девушка с битой

LeonidB

Их бин

LeonidB

Их бин

Linxy

Девушка с битой

Linxy

Девушка с битой

Linxy

Девушка с битой

LeonidB

Их бин

LeonidB

Их бин

Linxy

Девушка с битой

lev

Модератор

iv-mi

LeonidB

Их бин

iv-mi