在PHP里面利用正则表达式编写小偷程序的时候,我发现匹配字符串里不能包含中文,否则无法成功进行匹配。
代码如下:
<pre name="code" class="php">$preg= '#\[<a href=\'http://www.php100.com/html/itnews/it/\' class="a">IT资讯</a>\](.*)</a>#i';想匹配含"IT资讯"文字内容的超链接,不会取得成功,后来我用str_replace把“资讯”替换为“”后,代码变为如下:
$preg = '#\[<a href=\'http://www.php100.com/html/itnews/it/\' class="a">IT</a>\](.*)</a>#i';
即可匹配出页面中所有符合条件的超级链接。
最开始碰到无法匹配出超链接的时候,我怀疑是正则表达式[]组作为字符串参与匹配导致的,后来测试"\[(.*)\]"也都能成功匹配。
PS:正则表达式界定符“\....\”需要对其中的内容进行手动转义(主要针对http://里面的/改为\/),而界定符“#....#”则不需要加转义符,但是对于正则表达式符号需要当做字符串匹配的,还是需要加转义。