PHP正则表达式基本语法

本章主要学习正则表达式的基本语法；

正则表达式就是一个匹配的模式，正则表达式本身也就是一个字符串（有一些语法规则，特殊符号组成）

正则表达式这个字符串一定要在对应的函数中使用才有意义（分割，替换函数结合使用）

1、定界符 / /

2、原子最小的一个匹配单元（放在 / / 中，在正则表达式中，至少有一个。例如：$reg = '/ 7 /' ）

3、元字符元字符是不能单独使用的，用来修饰元子的，用来扩展原子功能和限字的做补充说明（协助定界符中例如：$reg = '/{5}/' ）

4、模式修正符修正，对模式（正则）修正（写在定界符的外面，写在右边例如： $reg = '/ {5} / i ' 中的i）

一、界定符号

　　界定符就表示一个正则表达式的开始和结束

　　例如：/[0-9]/ | #[0-9]# | {[0-9]} 常用写法建议使用斜杠；// $pattern = '/[0-9]/'

二、原子

可见原子：

　　　　1、标点符号； ‘’ _ ? . 等等

　　　　2、英文字母数字 a-z, A-Z, 0-9

　　　　3、汉语，日文，阿拉伯文等其他文字

　　　　4、数理化公司符号

　　　　5、其他可见字符

　　不可见原子：

　　　　1、换行符 \n

　　　　2、回车 \r

　　　　3、制表符 \t

　　　　4、空格

　　　　5、其他看不见的符号

　　(所有的数字，所有的字，所有的空白，所有的字母，特殊符号如下)

　　. 匹配除换行符之外的任意字符

　　\d (所有的数字) 代表任意一个数字 [ 0-9 ]

　　\D (代表所有非数字) 代表任何一个非数字 [ ^0-9 ]　　

　　\w 代表任意一个字，a-z A-Z, 0-9 _ [ a-zA-Z0-9_]

　　\W 代表任意一个非字，a-z A-Z 0-9 _ 之外的所有字符 [ ^ a-zA-Z0-9_ ]

　　\s 代表空白 [ \t \n \f \v ]

　　\S 代表任意一个非空白 [^ \t \n \f \v ]

　　自定义原子表

　　　　[ 13579 ]

　　　　[ a-zA-Z] 说明：- 是从哪到哪

　　　　[ ^a-zA-Z ] 说明： ^ 是除了什么

　　说明：（ . ）点，能代表所有的一个原子

三、元字符

　　元字符这个不能在正则表达式中单独使用，用来修饰原子的

　　元字符即原子的筛选方式

　　* 用来修饰前面的原子可以出现 0 个 1 个或者多个

　　+ 用来修饰前面的原子出现的次数 1 次或多次（不能没有一次）

　　？用来修饰前面的原子出现的次数 0 次或 1次

　　{ m } 用来修饰前面的原子出现 m 次，多一次少一次都不行

　　{ n, m } 用来修饰前面的原子出现的个数，在 n 到 m 之间，包含 n, m

　　{ n, } 用来修饰前面的原子可以出现至少 n 次，包含 n

　　| 或的关系，表示它两边的原子，只有有一个出现就可以，但是 | 的优先级最低

　　^ 和 \A 表示必须以什么开始，必须写在正则表达式的前面

　　$ 和 \Z 表示必须以什么结束，必须写在正则表达式的后面

　　\b 单词边界

　　\B 非单词边界

　（）第一个作用：改变优先级别

　　　　$str = ' orisaabc';

　　　　$reg = '/ or（is|a）abc/';

　　　第二个作用：将小原子变成大原子

　　　　$str = 'sqlsalabcsqlddfd';

　　　　$reg = '/(sql)*/';

　　第三个作用：子模式，整个表达式是一个大模式，小括号中的是每一个独立的子模式

　　第四个作用：反向引用

　？：取消子模式,作为大模式用（？：\d{4}）

　\1　取子模式

四、模式修正符

　　模式修正符要放在定界符之外，放在右边，模式修正符一个字符就是一个功能，可以组合使用；

　　例如： “/ go*gle/ i ”; "/go*gle/ ieu";

　　作用：

　　　　模式修正符号可以修正正则表达式的解释，或者扩充正则表达式的功能；

　　i 不区分大小写（默认是区分大小写）

　　m 修正符号修正正则表达式可以视为多行，在使用 ^ 或 $ 时每一行满足都可以（默认为一行）

　　s 用来修正正则表达式中的换行符号，是包含换行符，不用 s 则不包含换行符，默认不包含换行符

　　x 忽略修正正则表达式可以省略多个单词之间的空白

　　U (.* , .+) 正则表达式比较贪婪，.*? 和 .+？可以取消贪婪

　　贪婪的案例：

$pattern = '/myistest.+123/';

$subject = 'you look myistest__123123123123';

$matche = [];

preg_match($pattern, $subject, $matche);

show($matche);

　　贪婪的结果：

Array

(

    [0] => myistest__123123123123

)

　　取消贪婪的大U:

$pattern = '/myistest.+123/U';

$subject = 'you look myistest__123123123123';

$matche = [];

preg_match($pattern, $subject, $matche);

show($matche);

　　取消贪婪的结果：

Array

(

    [0] => myistest__123

)

　　忽略大小写的案例：i 的用法

$pattern = '/myisTest.+123/Ui';

$subject = 'you look myistest__123123123123';

$matche = [];

preg_match($pattern, $subject, $matche);

show($matche);

　　输出结果同上；不加 i 是匹配不到结果的；

　　忽略空白符的案例： x 的使用

$pattern = '/m yi s Test.+123/Uix';

$subject = 'you look myistest__123123123123';

$matche = [];

preg_match($pattern, $subject, $matche);

show($matche);

　　输出结果同上，不加 x 是匹配不到结果的；

五、实战应用

　　1、非空匹配　　‘/.+/’

　　2、浮点数匹配（保留2位）‘/(?!0\.00)(\d+\.\d{2}$)/’　　

$subject = ['1.00', '2.345', '0.23', '234', '23.22', '0.00'];

$matche = [];

for ($i = 0; $i < count($subject); $i++){

    if(preg_match('/(?!0\.00)(\d+\.\d{2}$)/', $subject[$i], $matche)){

        show($matche);

    }

}

　　结果：

Array

(

    [0] => 1.00

    [1] => 1.00

)

Array

(

    [0] => 0.23

    [1] => 0.23

)

Array

(

    [0] => 23.22

    [1] => 23.22

)

　　3、手机号码 ‘/^1(3|4|7|8)\d{9}$/’

　　4、Email地址 ‘/^([0-9A-Za-z\\-_\\.]+)@([0-9a-z]+\\.[a-z]{2,3}(\\.[a-z]{2})?)$/i’ 或者 ‘/^\w+(\.\w+)*@\w+(\.\w+)+$/’

　　5、常见URL地址 '/^(https?://)?(\w\.)+[a-zA-Z]+$/'

　　注：学习笔记

秒客网

PHP正则表达式基本语法

相关文章