PHP正则表达式(1):匹配字符串不能包含中文

时间:2021-02-24 18:48:01

在PHP里面利用正则表达式编写小偷程序的时候,我发现匹配字符串里不能包含中文,否则无法成功进行匹配。

代码如下:

<pre name="code" class="php">$preg= '#\[<a href=\'http://www.php100.com/html/itnews/it/\' class="a">IT资讯</a>\](.*)</a>#i';
 

想匹配含"IT资讯"文字内容的超链接,不会取得成功,后来我用str_replace把“资讯”替换为“”后,代码变为如下: 

$preg = '#\[<a href=\'http://www.php100.com/html/itnews/it/\' class="a">IT</a>\](.*)</a>#i';

即可匹配出页面中所有符合条件的超级链接。

最开始碰到无法匹配出超链接的时候,我怀疑是正则表达式[]组作为字符串参与匹配导致的,后来测试"\[(.*)\]"也都能成功匹配。

PS:正则表达式界定符“\....\”需要对其中的内容进行手动转义(主要针对http://里面的/改为\/),而界定符“#....#”则不需要加转义符,但是对于正则表达式符号需要当做字符串匹配的,还是需要加转义。