baiduindex-crawl

时间:2024-05-19 09:01:35
【文件属性】:

文件名称:baiduindex-crawl

文件大小:16KB

文件格式:ZIP

更新时间:2024-05-19 09:01:35

Python

百度指数爬行 收集特定时间和特定人的百度索引 主码 百度索引主要代号 SQLTools.py 访问数据库 ReadXml.py 读取xml的工具 运行环境 Selenium MySQL数据库 pytesseract 数据结构(MySQL) CREATE TABLE `baidu_index` ( `input_id` int(11) NOT NULL AUTO_INCREMENT, `status` int(11) NOT NULL, `keyword` varchar(50) DEFAULT NULL, `time` varchar(45) CHARACTER SET latin1 DEFAULT NULL, `index` longtext, PRIMARY KEY (`input_id`) ) ENGINE=InnoDB AUTO_INCREMENT=10


【文件预览】:
baiduindex-crawl-master
----Attri.xml(584B)
----SQLTools.py(1KB)
----BaiduIndexCrawl.py(12KB)
----.idea()
--------misc.xml(208B)
--------modules.xml(280B)
--------BaiduIndex0301.iml(398B)
--------workspace.xml(49KB)
----BaiduIndexCrawl.py.bak(12KB)
----README.md(2KB)
----ReadXml.py(301B)

网友评论