【文件属性】:
文件名称:GooglePlayCrawler:Google Play 的爬虫。 代码为Java编写,为人族编码测试编写
文件大小:4.03MB
文件格式:ZIP
更新时间:2021-06-06 06:18:26
Java
谷歌游戏爬虫
Google Play 的爬虫。 代码为Java编写,为人族编码测试编写。
添加 HTML 解析器
编写从 google play 中提取内容的代码: :
用SQLite编写dao和数据库访问代码
编写一个报告类来显示结果。
对“显示更多”按钮的操作进行逆向工程。 -> 发送帖子数据的“开始”和“编号”字段。
去做:
确定“列表结束”的标志。 似乎 top sell_* 列表中的项目数与 600 挂钩。
对“下一个评论页面”的操作进行逆向工程网址可能是和帖子数据是:reviewType 0, pageNum 2, id : package id, reviewSortOrder: 2
重构为多线程模型以提高爬行速度。
如何运行:
在执行程序之前,您必须从站点制作认证文件。
连接站点并查看列表。
从网络浏览器中提取认证。 我已将文件保存在资源文件夹中并
【文件预览】:
GooglePlayCrawler-master
----.gitignore(12B)
----src()
--------crawler()
----resource()
--------DER_Encoded_Google_Certificate.cer(2KB)
----.classpath(417B)
----.settings()
--------org.eclipse.core.resources.prefs(55B)
--------org.eclipse.jdt.core.prefs(587B)
----libs()
--------jsoup-1.8.1.jar(294KB)
--------sqlite-jdbc-3.8.7.jar(3.78MB)
----README.md(1KB)
----.project(376B)