爬虫解码gb1312类型

今天我爬虫的时候竟然遇见了网页编码为gb1312类型的网站，不是平常的utf-8

遇到这种类型的时候忽视它是最好的办法

① respond.content.decode('gb18030'，'ignore') ---亲试遇见中文响应内容解析还是用这种方式好

② respond.content.decode('gbk'，'ignore')

总结：遇见中文编码decode里面，'gbk'/'gbk2312'/'gb18030' （备用繁体编码选项没用过，可以留用'big5'/'big5hkscs'）总有一款适合你

秒客网