vim查看文件,发现多了<200b>字符,使用/200b搜索匹配不上;
grep 200b 也匹配不上
查询后才知道:
200b是:Unicode Character 'ZERO WIDTH SPACE' (U+200B)
参见:
http://www.fileformat.info/info/unicode/char/200B/index.htm
处理方法见:
http://superuser.com/questions/207207/how-can-i-delete-u200b-zero-width-space-using-sed
sed 's/\xe2\x80\x8b//g' inputfile