SimpleWebCrawler:使用 jsoup 演示一个简单的爬虫以及如何从 html 元素(表、div 等)中提取数据

时间:2024-07-02 12:25:10
【文件属性】:

文件名称:SimpleWebCrawler:使用 jsoup 演示一个简单的爬虫以及如何从 html 元素(表、div 等)中提取数据

文件大小:7KB

文件格式:ZIP

更新时间:2024-07-02 12:25:10

Java

简单的网络爬虫 使用 jsoup 演示一个简单的爬虫以及如何从 html 元素(表、div 等)中提取数据 主类:CarwaleCrawler.java -> 获取特定模型所有变体的价格详情主类:CarListCrawler.java -> 获取所有制造商的所有模型 需要名为 :crawler 的 DB 以及下表: CREATE TABLE carwale_cars ( name varchar(100) NOT NULL, advancedUrl varchar(100) DEFAULT NULL, price varchar(100) DEFAULT NULL ) 创建表CarWaleMakerToModel ( maker varchar(50) DEFAULT NULL, maker_id int(11) NOT NULL DEFAULT '0', model varchar(


【文件预览】:
SimpleWebCrawler-master
----build.xml(3KB)
----manifest.mf(82B)
----src()
--------crawler()
----README.md(839B)

网友评论

  • 用户下载后在一定时间内未进行评价,系统默认好评。