Особенности кириллицы в регулярках Python
Большим преимуществом регулярок в Python
является то, что кириллические символы входят в группу
\w
. Давайте заменим все латинские
и кириллические буквы в следующей
строке:
txt = 'x232x 456 xax xтекстx'
res = re.sub('x[\w]*x', '!', txt)
print(res)
Результат выполнения кода:
'! 456 ! !'
Также кириллические буквы можно искать
с помощью группы в квадратных скобках:
[а-я]
. Но с ней есть проблема - сюда
не войдет буква 'ё'
. Для ее включения
нужно дописать эту букву к группе:
res = re.sub('x[а-яё]*x', '!', txt)
print(res)
Результат выполнения кода:
'! 456 xax !'
Дана строка:
txt = 'wйw wяw wёw wqw'
Напишите регулярку, которая найдет строки
по шаблону: по краям стоят буквы 'w'
,
а между ними - буква кириллицы.
Дана строка:
txt = 'ааа ббб ёёё ззз ййй ААА БББ ЁЁЁ ЗЗЗ ЙЙЙ'
Напишите регулярку, которая найдет все слова по шаблону: любая кириллическая буква любое количество раз.