python中request库的使用

时间:2022-09-25 05:32:13
理解Response的编码


属性                 说明
r.encoding           从HTTP header中猜测的响应内容编码方式
r.apparent_encoding  从内容中分析出的响应内容编码方式(备选编码方式)


r.encoding:如果header中不存在charset,则认为编码为ISO-8859-1
r.apparent_encoding:根据网页内容分析出的编码方式


Requests库入门


try:
    r = requests.get(url, timeout=30)
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    return r.text
except:
    return "产生异常"


爬取网页的通用代码框架