scrapy-requests:Scrapy中间件使用request-html处理javascript页面

时间:2024-05-24 09:16:34
【文件属性】:

文件名称:scrapy-requests:Scrapy中间件使用request-html处理javascript页面

文件大小:7KB

文件格式:ZIP

更新时间:2024-05-24 09:16:34

Python

拼命的要求 Scrapy中间件可使用request-html异步处理javascript页面。 request-html使用pyppeteer加载javascript页面,并为您处理用户代理规范。 使用requests-html非常直观和简单。 要求 Python> = 3.6 Scrapy> = 2.0 request-html 安装 pip install scrapy-requests 配置 扭曲使用Asyncio事件循环,并将RequestsMiddleware添加到下载器中间件 settings.py TWISTED_REACTOR = 'twisted.internet.asyncioreactor.AsyncioSelectorReactor' DOWNLOADER_MIDDLEWARES = { 'scrapy_requests.RequestsMid


【文件预览】:
scrapy-requests-main
----.travis.yml(391B)
----tests()
--------test_request.py(2KB)
--------__init__.py(0B)
----tox.ini(317B)
----LICENSE(1KB)
----setup.cfg(255B)
----requirements.txt(35B)
----setup.py(1KB)
----README.md(2KB)
----scrapy_requests()
--------request.py(706B)
--------middleware.py(2KB)
--------__init__.py(96B)

网友评论