Регулярные выражения (сокращенно — РВ), которые используются в поиске и при сегментировании — полностью поддерживаются Java. Если вам нужна более точная информация, обратитесь по адресу http://java.sun.com/j2se/1.5/docs/api/java/util/regex/Pattern.html. Ниже приведены несколько примеров и ссылок.
Выражение... |
соответствует следующему: |
Флаги |
|
|
Включает поиск совпадений независимо от регистра символов (по умолчанию все шаблоны чувствительны к регистру) |
Символы |
|
|
Символ x, кроме следующего... |
|
Символ с шестнадцатеричным значением |
|
Символ табуляции ( |
|
Символ новой строки (прогон строки) ( |
|
Символ возврата каретки ( |
\f |
Символ прогона страницы ('\u000C') |
\a |
Символ звонка (оповещения) ('\u0007') |
\e |
Символ Escape('\u001B') |
\cx |
Управляющий символ, соответствующий x |
\0n |
Символ с восьмеричным значением 0n (0 <= n <= 7) |
\0nn |
Символ с восьмеричным значением 0nn (0 <= n <= 7) |
\0mnn |
Символ с восьмеричным значением 0mnn (0 <= m <= 3, 0 <= n <= 7) |
\xhh |
Символ с шестнадцатеричным значением 0xhh |
Кавычки |
|
|
Только закавычивает следующий символ. Это нужно, если вы хотите ввести метасимволы |
|
Например, это будет символ обратной косой черты. |
|
Только закавычивает все символы до |
|
Только прекращает закавычивание, начатое \Q |
Классы блоков и категорий Unicode |
|
|
Символ в греческом блоке (простой блок) |
|
Большая буква (простая категория) |
|
Обозначение денежной единицы |
|
Любой символ кроме одного в греческом блоке (отрицание) |
|
Любая буква кроме больших (вычитание) |
Классы символов |
|
|
|
|
Любой символ, кроме |
|
От |
Предустановленные классы символов |
|
|
Любой символ (кроме символов конца строки) |
|
Цифра: |
|
Не цифра: |
|
Символ пробела: |
|
Не символ пробела: |
|
Словообразующий символ: |
|
Не образующий слова символ: |
Границы |
|
|
Начало строки |
|
Конец строки |
|
Граница слова |
|
Не граница слова |
«Жадные» кванторы |
|
Они будут искать как можно больше совпадений. Например, |
|
X |
X, один раз или ни разу |
X |
X, ноль или больше раз |
X |
X, один или больше раз |
«Ленивые» («нежадные») кванторы |
|
Они будут искать как можно меньше совпадений. Например, |
|
X |
X, один раз или ни разу |
X |
X, ноль или больше раз |
X |
X, один или больше раз |
Логические операторы |
|
XY |
X, за которым идёт Y |
X |
Или X или Y |
|
XY как отдельная группа |
Регулярное выражение | Результат поиска: |
(\b\w+\b)\s\1\b |
двойные слова |
[\.,]\s*[\.,]+ | где спутаны точки и запятые |
\. \s$ | лишние пробелы после точки в конце строки |
\s+a\s+[aeiou] | В английском языке: слова, начинающиеся с гласных, перед которыми нужно ставить «an», а не «a» |
\s+an\s+[^aeiou] | В английском языке: проверка подобная предыдущей, но на слова, начинающиеся на согласные («a», а не «an») |
\s\s+ | больше, чем один пробел подряд |
\.[A-Z] | отсутствует пробел между точкой и началом предложения |
Авторские права | Наверх | Предметный указатель |