Специальные символы ERE

Расширенные регулярные выражения

Привязки

Приоритет BRE

BRE соответствующие нескольким символам

Следующие правила могут использоваться для построения базовых регулярных выражений со­ответствующих нескольким символам из BRE соответствующих одному символу:

1. Объединение BRE соответствует объединению строк соответствующих каждому из компо­нентов BRE.

2. Могут определяться подвыражения, путем заключения BRE между парами символов \( и \). Такие выражения соответствуют тому же, чему и без символов \( \).

3. Выражение обратной ссылки

n соответствует той же строке (возможно пустой), что и подвыражение предшествующее n. Символ n является цифрой от 1 до 9 включительно и определяет номер подвыражения в строке.

4. Если за BRE соответствующим одному символу, подвыражением или обратной ссылкой сле­дует символ звездочки, то такое выражение (вместе с символом звездочки) соответствует нулю или более последовательных включений соответствующих данному BRE.

5. Если за BRE соответствующим одному символу, подвыражением или обратной ссылкой следует интервальное выражение вида \{т\}, \{т,\} или \{т,п\}, то такое выражение (вместе с интервальным выражением) соответствует определенному интервальным выраже­нием числу включений соответствующих данному BRE. Выражение \{т\} соответствует точно m включениям, выражение \{т,\} соответствует не менее чем m включениям и выражение \{m,n\} соответствует числу включений от m до n включительно.

[= =] [: :] [• •] \<специальный символ>

[ ]

\( \) \п

* \{m,n\}
л$

BRE могут быть привязаны к началу или концу строк. Правила привязки следующие:

1. Уголок (Л), когда является первым символом всего регулярного выражения, соответствует началу строки.

2. Знак доллара, когда является последним символом всего регулярного выражения, соответ­ствует концу строки.

3. BRE ограниченное символами Ли $ соответствует только целой строке.

3.1 Расширенные регулярные выражения соответствующие единственно­
му символу или сопоставимому элементу

В ERE обычный символ, специальный символ с предшествующей обратной чертой или точка соответствуют одному символу. Выражение в квадратных скобках соответствует единственному символу или сопоставимому элементу. Обычный символ в ERE соответствует сам себе. Это любой символ из используемого кодового набора, за исключением специальных символов ERE.

Специальные символы ERE имеют особые свойства в некотором контексте. За пределами этого контекста или будучи предварены обратной косой чертой, такие символы соответствуют сами себе. Специальные символы и контексты в которых они имеют специальное значение следующие:

[\( имеют специальное значение за исключением использования внутри квадратных скобок.

) имеет специальное значение когда соответствует открывающей скобке.

* + ? { |

имеют специальное значение за исключением случаев использования внутри квадрат­ных скобок.

Лимеет специальное значение когда используется в качестве символа привязки, либо

является первым символом выражения в квадратных скобках.

$ имеет специальное значение когда используется в качестве символа привязки.

Точка является ERE соответствующим любому символу из поддерживаемого множества за ис­ключением NULL.