检测2个url的不同之处(爬虫分析接口)

时间:2022-01-14 16:34:29

就是简单的检测2个url的不同之处,在做爬虫时,要分析接口地址的不同之处,靠自己的眼睛有点累,所以写了一个小程序,不喜勿喷

#测试数据
a = "https://list.tmall.com/search_product.htm?spm=a220m.1000858.1000724.5.31ed23ff7Mb3Bh&cat=50024400&brand=81156&q=%CA%D6%BB%FA&sort=p&style=g&from=sn_1_brand-qp&suggest=0_1&active=1&industryCatId=50024400#J_Filter"
b = "https://list.tmall.com/search_product.htm?spm=a220m.1000858.1000724.4.48bd23ffUsRB64&cat=50024400&brand=81156&q=%CA%D6%BB%FA&sort=d&style=g&from=sn_1_brand-qp&suggest=0_1&active=1&industryCatId=50024400#J_Filter" #定义查找函数
def findd(s1,s2):
#定义遍历次数lenght,并将s2的个数赋值给lenght
lenght=len(s2)
#判断2个url的长度,如果s1的个数大于s2的话,就讲s1的个数赋值给lenght
if len(s1)>len(s2):
lenght = len(s1)
#定义2个空字符串,用于存放从s1,s2中找到的不同字符
a = ""
b = ""
#遍历s1,s2
for i in range(lenght):
if s1[i]!=s2[i]:
a +=s1[i]
b +=s2[i]
#测试时用的,可以注释掉
print(a,b)
#返回2个url的不同之处
return a,b findd(a,b)