用url传值中文乱码的问题(爬取网页内容的时候)

时间:2021-09-21 20:10:57
爬取网页的内容的时候
网址如下:
http://ircs.p5w.net/ircs/interaction/queryQuestionByGszz.do?condition.keyWord=民营银行&condition.status=3&condition.searchType=content
进入页面后不能搜索到民营银行的相关内容,反而在输入框出现乱码,民营银行在页面上显示为由于页面编码和后台编码不同,怎么样按照特定的中文关键词进行爬去网页内容
求大虾解决!


本人使用的java  、jsoup来爬取网页内容!

2 个解决方案

#1


没写过。但是URL访问的话不是有那个URLEncoder.encode方法来进行转码吗?

#2


你是post 提交的吗?

#1


没写过。但是URL访问的话不是有那个URLEncoder.encode方法来进行转码吗?

#2


你是post 提交的吗?