文件名称:SimpleWebCrawler:使用 jsoup 演示一个简单的爬虫以及如何从 html 元素(表、div 等)中提取数据
文件大小:7KB
文件格式:ZIP
更新时间:2024-07-02 12:25:10
Java
简单的网络爬虫 使用 jsoup 演示一个简单的爬虫以及如何从 html 元素(表、div 等)中提取数据 主类:CarwaleCrawler.java -> 获取特定模型所有变体的价格详情主类:CarListCrawler.java -> 获取所有制造商的所有模型 需要名为 :crawler 的 DB 以及下表: CREATE TABLE carwale_cars ( name varchar(100) NOT NULL, advancedUrl varchar(100) DEFAULT NULL, price varchar(100) DEFAULT NULL ) 创建表CarWaleMakerToModel ( maker varchar(50) DEFAULT NULL, maker_id int(11) NOT NULL DEFAULT '0', model varchar(
【文件预览】:
SimpleWebCrawler-master
----build.xml(3KB)
----manifest.mf(82B)
----src()
--------crawler()
----README.md(839B)