specification:一个社区制定的用于抓取 JavaScript 密集型网站的合约

时间:2024-07-22 02:41:39
【文件属性】:

文件名称:specification:一个社区制定的用于抓取 JavaScript 密集型网站的合约

文件大小:5KB

文件格式:ZIP

更新时间:2024-07-22 02:41:39

启用 JavaScript 的爬网规范 谷歌通过在抓取互联网时执行 JavaScript 实现了飞跃。 但是,JavaScript 密集型网站和单页应用程序的开发人员无法使用它,因为还没有其他爬虫执行 JavaScript。 这是可以理解的,因为启用 JS 的爬行涉及一些繁重的工作。 尽管如此,谷歌通过最重要的切断 AJAX 调用找到了一个最佳点。 通过这种方式,爬虫和网络开发人员可以在中间相遇。 该规范应允许抓取工具的实施者跟随 Google 的脚步,并为框架和网站开发者提供可依赖的合同。 在这篇阅读更多关于动机的。 转到的。 贡献 你可以: 为这个项目加星,为这个社区工作添加你的声音, 打开一个问题以提供反馈并讨论规范的某些方面,以及 根据讨论得到解决的问题创建拉取请求。 随时欢迎新的核心贡献者!


【文件预览】:
specification-master
----specification.md(2KB)
----LICENSE(6KB)
----README.md(1KB)

网友评论