文件名称:html-get:从任何网站获取HTML,必要时使用预渲染
文件大小:137KB
文件格式:ZIP
更新时间:2024-05-19 10:19:42
JavaScript
从任何网站获取HTML,必要时使用预渲染。 特征 从任何网站(以及客户端应用程序)获取HTML标记。 基于域白名单的预渲染检测。 加快阻止广告跟踪器的过程。 正确编码正文响应。 像这样的无头技术使我们能够从任何网站获取HTML标记,即使目标URL是客户端应用程序,我们也需要等到dom事件触发才能获取真实标记。 通常,此方法比来自目标URL的简单GET请求更好,但是由于您需要等待dom事件,因此预渲染可能会很慢,并且在某些情况下是不必要的(使用服务器端渲染的网站可以通过简单的GET进行解析)。 html-get结合了两个方面的优点,执行以下算法: 确定目标URL是否确实需要预(在内部,它具有不需要的)。 如果需要预渲染,请使用Headless技术执行操作,阻止广告跟踪程序的请求以加快流程,并尝试在最短的时间内解决主要请求。 如果不需要预渲染或由于任何原因(例如超时)而导致预
【文件预览】:
html-get-master
----.gitattributes(12B)
----src()
--------html.js(4KB)
--------index.js(4KB)
----scripts()
--------postinstall(1KB)
----.travis.yml(767B)
----LICENSE(1KB)
----test()
--------fixtures()
--------prerender.js(935B)
--------html.js(9KB)
--------snapshots()
--------util.js(119B)
--------index.js(3KB)
----README.md(5KB)
----.npmrc(59B)
----.editorconfig(364B)
----.gitignore(480B)
----bin()
--------index.js(723B)
----CHANGELOG.md(37KB)
----package.json(3KB)