网址如下:
http://ircs.p5w.net/ircs/interaction/queryQuestionByGszz.do?condition.keyWord=民营银行&condition.status=3&condition.searchType=content
进入页面后不能搜索到民营银行的相关内容,反而在输入框出现乱码,民营银行在页面上显示为由于页面编码和后台编码不同,怎么样按照特定的中文关键词进行爬去网页内容
求大虾解决!
本人使用的java 、jsoup来爬取网页内容!
2 个解决方案
#1
没写过。但是URL访问的话不是有那个URLEncoder.encode方法来进行转码吗?
#2
你是post 提交的吗?
#1
没写过。但是URL访问的话不是有那个URLEncoder.encode方法来进行转码吗?
#2
你是post 提交的吗?