php 5.3.5 preg_match BUG!!!

//环境 window+php3.35+apache2.2
今天在写用正则验证用户名的时候,中文,英文都没有问题

可是用这个字注册的时候就除了问题

echo preg_match("/[\'\"\ \　]/","净");

//文件是utf-8的也设置了header("Content-type:text/html;charset=utf-8");

正常情况下,应该输出0,对吧,可是竟然输出为1,大家可以试一下!

还有这个问题怎么解决呢!

5 个解决方案

#1

有 BUG 并不奇怪！正因为如此，php 才建议你升级到 5.3.22 或 5.4.12

不过你说的BUG并不存在
正则规则串的 [] 中的是单字符列表，而全角的空格是多字符
你至少需要有 u 修饰符
echo preg_match("/[\'\"\ \　]/u","净");

#2

您是对的,非常感谢!

百度了一下,u是贪婪模式,能解释一下为什么吗？

还有为什么别的中文字符没有出错,唯独这个"净"字呢？

#3

问题出在 [\'\"\ \　] ，最后一个空白是一个多字节字符 %E3%80%80
而净字的编码为 %E5%87%80
这两个之间有 80 为重复的，所以会匹配到相同的字节

#4

引用 3 楼 dream1206 的回复:

问题出在 [\'\"\ \　] ，最后一个空白是一个多字节字符 %E3%80%80
而净字的编码为 %E5%87%80
这两个之间有 80 为重复的，所以会匹配到相同的字节

+1
不加unicode修正符就按字节匹配
所以%80 bingo!

#5

引用 2 楼 aszt123 的回复:

百度了一下,u是贪婪模式,能解释一下为什么吗？

还有为什么别的中文字符没有出错,唯独这个"净"字呢？

你有错了！U 是贪婪模式开关
而 u 是 utf-8 修正模式。在此模式下，任何 utf-8 字符都当做一个字节处理

#1

#2

您是对的,非常感谢!

百度了一下,u是贪婪模式,能解释一下为什么吗？

还有为什么别的中文字符没有出错,唯独这个"净"字呢？

#3

问题出在 [\'\"\ \　] ，最后一个空白是一个多字节字符 %E3%80%80
而净字的编码为 %E5%87%80
这两个之间有 80 为重复的，所以会匹配到相同的字节

#4

引用 3 楼 dream1206 的回复:

问题出在 [\'\"\ \　] ，最后一个空白是一个多字节字符 %E3%80%80
而净字的编码为 %E5%87%80
这两个之间有 80 为重复的，所以会匹配到相同的字节

+1
不加unicode修正符就按字节匹配
所以%80 bingo!

#5

引用 2 楼 aszt123 的回复:

百度了一下,u是贪婪模式,能解释一下为什么吗？

还有为什么别的中文字符没有出错,唯独这个"净"字呢？

你有错了！U 是贪婪模式开关
而 u 是 utf-8 修正模式。在此模式下，任何 utf-8 字符都当做一个字节处理

秒客网

php 5.3.5 preg_match BUG!!!

5 个解决方案

#1

#2

#3

#4

#5

#1

#2

#3

#4

#5

相关文章