文件名称:JDRecommendation:京东商品推荐系统-数据爬虫
文件大小:52KB
文件格式:ZIP
更新时间:2024-07-03 07:53:04
Java
京东商品推荐系统 数据爬虫部分 本项目用来抓取京东商城的食品区域的商品信息、评价信息和用户数据,数据库采用Mysql。 爬虫的核心模块采用,主要实现了JDPageProcessor类,继承自PageProcessor。 采用XPath和CSS Selector两种模式抽取网页信息。如抽取商品页面用户链接信息: String aHref = html.xpath("div[@class='item']/div[@class='user']/div[@class='u-icon']/a/@href").toString(); 采用的是Xpath抽取方式,过程:提取html中class为item的div中的class为user的div中的class为u-icon中的超链接。`
【文件预览】:
JDRecommendation-master
----.project(367B)
----.gitattributes(483B)
----src()
--------com()
--------log4j.properties(2KB)
----.idea()
--------misc.xml(5KB)
--------compiler.xml(711B)
--------uiDesigner.xml(9KB)
--------workspace.xml(72KB)
--------dataSources.xml(778B)
--------.name(16B)
--------encodings.xml(166B)
--------dataSources.ids(649B)
--------modules.xml(274B)
--------scopes()
--------copyright()
--------vcs.xml(182B)
----README.md(704B)
----JDRecommendation.iml(9KB)
----.classpath(2KB)
----.gitignore(485B)
----bin()
--------com()
--------log4j.properties(2KB)