lower_colon = re.compile(r'^([a-z]|_)*:([a-z]|_)*$')
problemchars = re.compile(r'[=\+/&<>;\'"\?%#$@\,\. \t\r\n]')
def key_type(element, keys):
#print(element.tag)
if element.tag == "tag":
t = {}
t=element.attrib
print(t['k'])
l = re.match(lower,t['k'])
lc = re.match(lower_colon,t['k'])
p = re.search(problemchars,t['k'])
print(p)
if l != None:
keys['lower'] += 1
elif lc!= None:
keys['lower_colon'] += 1
elif p != None:
keys['problemchars'] += 1
else:
keys['other'] += 1
# YOUR CODE HERE
pass
请完成函数“key_type”,并得出这四大标记类别在字典中的各自数量:
- “lower”,表示仅包含小写字母且有效的标记,
- “lower_colon”,表示名称中有冒号的其他有效标记,
- “problemchars”,表示字符存在问题的标记,以及
- “other”,表示不属于上述三大类别的其他标记。
re.match与re.search的区别
re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配。