之前在国际版本中,需要支持中英文切换功能,在如此繁多的源文件里要查找源文件里的key是语言资源包是否对应。
正好运用在之前学的python,写了个工具,支持自定义替换标签,批量处理源文件。现在看来,效果还是不错的,可以扫描出不匹配的key。
源文件连接:http://pan.baidu.com/s/1ntC78Zv
期间遇到的难题是这样的:
语言包中存在如下key-value对:"我是;key\"\,\'" : "i am; key\"\,\'"
之前用的正则表达式是这样:re.compile('"(.*?)"'),这样只能匹配到"我是key\"。
解决方法有多种,我用的方法分为几步:
一、把整句的\.变以\,即变为:"我是;key\\\" : "i am; key\\\"
二、这时就可以用re.compile('"(.*?)"'),获取到 我是;key\\\
三、再把第一步的替换回来,即变为:我是;key\"\,\'
fd=open(jsonFilePath,'r')
data=fd.readline()
while data:
data=data.decode('utf-8')
#print 'raw data:'+data #第一步,找到替换
p=re.compile(r'(\\.)')
keeper=p.findall(data)
#print 'keeper:%s'%keeper data=p.sub(r'\\',data)
#print 'first:'+data #第二步,找到key
p2=re.compile(r'"(.*?)"') s=p2.search(data)
if None!=s:
data=s.group(1)
else:
data=fd.readline()
continue
#print 'second:'+data result='' #第三步,还原
for ke in keeper:
target=data.find('\\')
if target>=0:
result=result+data[:target]+ke
#print '----'+result
data=data[target+1:]
#print '--------'+data
result=result+data
result就是最后的结果,这就成功获取到的正常的语言包key,处理源文件也一样的原理