爬虫入门一(正则表达式)

时间:2022-06-24 22:16:04

1.基本字符

. 匹配任意一个字符
\ 转义特殊符号
[…] 匹配方括号中的任意一个

2.预定义字符集

\w和\W单词和非单词
\d和\D数字和非数字
\s和\S 空白和非空白

3.数量

* 匹配前面的 0次或无线
+ 匹配前面的1次或无限
? 匹配前面的0次或一次
{m,n} 匹配前面的m到n次。n不写表示正无穷。

4.边界匹配(直接看没看懂)

^ 匹配字符串开头,多行的话匹配每一行开头。
$ 匹配字符串结尾,多行的话匹配每一行结尾。
\A 只匹配字符串开头。
\Z 只匹配字符串开头。
\b 匹配\w和\W之间。
\B 和\b相反