文件名称:scrapy-playwright::performing_arts:适用于Scrapy的Playwright集成
文件大小:76KB
文件格式:ZIP
更新时间:2024-04-17 01:31:07
python python3 scrapy chrome-headless python-asyncio
Scrapy的Playwright集成 该项目提供了一个Scrapy下载处理程序,该程序使用执行请求。 它可用于处理需要JavaScript的页面。 该软件包不会干扰常规的Scrapy工作流程,例如请求计划或项目处理。 动机 在发布后,其中包括部分和实验性,Scrapy允许集成基于asyncio的项目,例如Playwright 。 要求 Python 3.7以上 Scrapy 2.0+ 剧作家0.7.0+ 安装 $ pip install scrapy-playwright 配置 通过替换默认的http和https下载处理程序: DOWNLOAD_HANDLERS = { "http" : "scrapy_playwright.handler.ScrapyPlaywrightDownloadHandler" , "https" : "scrapy_playwright
【文件预览】:
scrapy-playwright-master
----setup.py(1KB)
----.gitignore(147B)
----Makefile(368B)
----pyproject.toml(30B)
----scrapy_playwright()
--------__init__.py(22B)
--------page.py(448B)
--------handler.py(8KB)
----LICENSE(1KB)
----setup.cfg(30B)
----.github()
--------workflows()
----examples()
--------post.py(1KB)
--------exception.py(2KB)
--------storage.py(1KB)
--------scroll.py(1KB)
--------cookies.py(1KB)
----README.md(8KB)
----tests()
--------test_page_coroutines.py(474B)
--------__init__.py(0B)
--------mockserver.py(2KB)
--------test_playwright_requests.py(9KB)
--------site()
--------test_mixed_requests.py(2KB)
----requirements-dev.txt(51B)
----tox.ini(817B)