python中使用requests库获取网页内容

时间:2024-02-21 15:15:15

requests是python中的一个第三方库,可以获取网页内容

安装指令:pip install requests 如果是python3.0版本以上则是:pip3 install requests 命令行下输入 import requests 回车,不报错则安装成功

import requests 导入模块,注意py文件命名不能和模块名重复

网页有很多种打开方式,最常见的是get方式(直接输入网址访问)和post方式(从另一个页面单击链接进入)

get方式获取网页内容:requests.get(\'url\').content.decode()

先得到一个Response响应对象,用content方法转变为二进制字节数据类型对象bytes(中文在bytes中无法显示),用decode方法转变为字符串型的源代码

注意 .content 是用于显示有图片,音频,视频等内容的网页,需要decode解码

.text 是用于显示只是字符的网页

上面方法的参数可以省略,默认使用utf-8编码格式,如果网页不是这种编码格式,需要在括号里写明目标编码格式的名字