正则表达式
正则表达式是一种匹配输入文本的模式。.Net框架提供了允许这种匹配的正则表达式引擎。模式由一个或多个字符、运算符和结构组成
正则表达式的本质还是一个字符串
1.1 正则表达式概述
正则表达式语言是一种专门用于字符串处理的语言。它包含两个功能:
- 一组用于表示字符类型的转义代码
- 一个系统,在搜索操作中,它把子字符串和中间结果的各个部分组合起来
1.2正则表达式的作用
- 检索:通过正则表达式,从字符串中获取我们想要的部分
- 匹配:判断给定的字符串是否符合正则表达式的过滤逻辑
可以认为正则表达式表述了一个字符串的书写规则,判断用户输入的密码是否合法,判断用户输入的邮箱正则表达式的匹配是按照每个位置的字符进行判断验证的
1.3正则表达式的组成-元字符
正则表达式就是由普通字符以及特殊字符(称为元字符)组成的文字模式。该模式描述在查找文字主体时待匹配的一个或多个字符串
1.3.1特殊符号元字符
元字符 | 描述 |
---|---|
@符号 | 正则表达式字符串前面加上@字符,这样不让编译器去解析其中的转义字符 |
*符号 | *代表0-多个字符 |
\符号 | \是转义字符. 是元字符,如果要表示一个\ . 字符的话,需要使用\ . * |
| | 将两个匹配条件进行逻辑“或”(Or)运算。 |
( ) | 用小括号来指定子表达式(也叫做分组) |
1.3.2定位元字符
元字符 | 描述 |
---|---|
\b | 匹配单词的开始或结束 |
\B | 匹配非单词的开始或结束 |
^ | 匹配必须出现在字符串的开头或行的开头 |
$ | 匹配必须出现在以下位置:字符串结尾、字符串结尾处的\n之前或行的结尾。 |
\A | 指定匹配必须出现在字符串的开头(忽略Multiline选项)。 |
\Z | 指定匹配必须出现在字符串的结尾(忽略Multiline选项)。 |
\z | 指定匹配必须出现在字符串的结尾或字符串结尾处的\n之前(忽略Multiline选项) |
\G | 定匹配必须出现在上一个匹配结束的地方。与()一起使用时,此断言确保所有匹配都 是连续的。 |
1.3.3基本语法元字符
元字符 | 描述 |
---|---|
. | 匹配除换行符以外的任意字符 |
\w | 匹配字母、数字、下划线、汉字(指大小写字母、0-9的数字、下划线_) |
\W | \w的补集(除“大小写字母、0-9的数字、下划线_”之外) |
\s | 匹配任意空白符 (包括换行符/n、回车符/r、制表符/t、垂直制表符/v、换页符/f) |
\S | \s的补集 (除\s定义的字符之外) |
\d | 匹配数字(0-9数字) |
\D | 表示\d的补集(除0-9数字之外) |
1.3.4反义字符
元字符 | 描述 |
---|---|
[ab] | 匹配中括号中的字符 |
[a-c] | a字符到c字符之间是字符 |
[ ^ x] | 匹配除了x以外的任意字符 |
[ ^adwz] | 匹配除了adwz这几个字符以外的任意字符 |
1.3.5重复描述字符
元字符 | 描述 |
---|---|
{n} | 匹配前面的字符n次 |
{n,} | 匹配前面的字符n次或多于n次 |
{n,m} | 匹配前面的字符n到m次 |
? | 重复零次或一次 |
+ | 重复一次或更多次 |
* | 重复零次或更多次 |
1.4Regex类
Regex 类用于表示一个正则表达式
方法 | 描述 |
---|---|
public bool IsMatch( string input, int startat ) | 指示Regex 构造函数中指定的正则表达式是否在指定的输入字符串中找到匹配项,从字符串中指定的开始位置开始。 |
public static bool IsMatch( string input, string pattern ) | 指示指定的正则表达式是否在指定的输入字符串中找到匹配项。 |
public MatchCollection Matches( s tring input ) | 在指定的输入字符串中搜索正则表达式的所有匹配项。 |
public string Replace( string inp ut, string replacement ) | 在指定的输入字符串中,把所有匹配正则表达式模式的所有匹配的字 符串替换为指定的替换字符串。 |
public string[] Split( string inp ut ) | 把输入字符串分割为子字符串数组,根据在 Regex 构造函数中指定的正则表达式模式定义的位置进行分割。 |
public bool IsMatch( string input) | 指示Regex构造函数中指定的正则表达式是否在指定的输入字符串中找到匹配项。 |
2.例子
Console.WriteLine("请输入合法的QQ号");
//QQ号的正确格式:5位,最多11位,纯数字,开头不能为0
string qq = Console.ReadLine();
//按照上面规则写正则
string pattern = @"^[1-9]\d{4,10}$";
if (Regex.IsMatch(qq, pattern))
{
Console.WriteLine("合法");
}
else
{
Console.WriteLine("QQ不合法");
}