php 5.3.5 preg_match BUG!!!

时间:2022-09-16 14:26:51
//环境 window+php3.35+apache2.2
今天在写 用正则验证用户名的时候,中文,英文都没有问题

可是 用这个字注册的时候就除了问题

echo preg_match("/[\'\"\ \ ]/","净");

//文件是utf-8的 也设置了header("Content-type:text/html;charset=utf-8");


正常情况下,应该输出0,对吧,可是竟然输出为1,大家可以试一下!

还有这个问题怎么解决呢!

5 个解决方案

#1


有 BUG 并不奇怪!正因为如此,php 才建议你升级到 5.3.22 或 5.4.12

不过你说的BUG并不存在
正则规则串的 [] 中的是单字符列表,而全角的空格是多字符
你至少需要有 u 修饰符
echo preg_match("/[\'\"\ \ ]/u","净");

#2


您是对的,非常感谢!

百度了一下,u是贪婪模式,能解释一下为什么吗?

还有为什么别的中文字符没有出错,唯独这个"净"字呢?

#3


问题出在  [\'\"\ \ ] ,最后一个空白是一个多字节字符  %E3%80%80
而 净 字的编码为 %E5%87%80
这两个之间有  80 为重复的,所以会匹配到相同的字节

#4


引用 3 楼 dream1206 的回复:
问题出在  [\'\"\ \ ] ,最后一个空白是一个多字节字符  %E3%80%80
而 净 字的编码为 %E5%87%80
这两个之间有 80 为重复的,所以会匹配到相同的字节


+1
不加unicode修正符就按字节匹配
所以%80 bingo!

#5


引用 2 楼 aszt123 的回复:
百度了一下,u是贪婪模式,能解释一下为什么吗?

还有为什么别的中文字符没有出错,唯独这个"净"字呢?

你有错了!U 是贪婪模式开关
而 u 是 utf-8 修正模式。在此模式下,任何 utf-8 字符都当做一个字节处理

#1


有 BUG 并不奇怪!正因为如此,php 才建议你升级到 5.3.22 或 5.4.12

不过你说的BUG并不存在
正则规则串的 [] 中的是单字符列表,而全角的空格是多字符
你至少需要有 u 修饰符
echo preg_match("/[\'\"\ \ ]/u","净");

#2


您是对的,非常感谢!

百度了一下,u是贪婪模式,能解释一下为什么吗?

还有为什么别的中文字符没有出错,唯独这个"净"字呢?

#3


问题出在  [\'\"\ \ ] ,最后一个空白是一个多字节字符  %E3%80%80
而 净 字的编码为 %E5%87%80
这两个之间有  80 为重复的,所以会匹配到相同的字节

#4


引用 3 楼 dream1206 的回复:
问题出在  [\'\"\ \ ] ,最后一个空白是一个多字节字符  %E3%80%80
而 净 字的编码为 %E5%87%80
这两个之间有 80 为重复的,所以会匹配到相同的字节


+1
不加unicode修正符就按字节匹配
所以%80 bingo!

#5


引用 2 楼 aszt123 的回复:
百度了一下,u是贪婪模式,能解释一下为什么吗?

还有为什么别的中文字符没有出错,唯独这个"净"字呢?

你有错了!U 是贪婪模式开关
而 u 是 utf-8 修正模式。在此模式下,任何 utf-8 字符都当做一个字节处理