first_scrap:使用多处理,随机代理和用户代理来对站点进行爬网

时间:2024-02-25 00:04:20
【文件属性】:

文件名称:first_scrap:使用多处理,随机代理和用户代理来对站点进行爬网

文件大小:19KB

文件格式:ZIP

更新时间:2024-02-25 00:04:20

python parsing selenium multithreading requests

First_scrap , First_scrap是一个用于具有随机代理和用户代理的多线程抓取站点的库。 安装 要开始使用first_scrap库,请激活(或在必要时创建)虚拟环境。 例如,如下: python3 -m venv env source ./env/bin/activate 要安装First_scrap,请使用pip软件包管理器: pip install firstscrap 另一种安装方法是从GitHub获取源代码。 为此,请在控制台中执行命令: git clone http://github.com/theodor85/first_scrap cd first_sc


【文件预览】:
first_scrap-master
----MANIFEST.in(158B)
----_config.yml(27B)
----tests()
--------scrap.py(5KB)
--------test_one_page.py(272B)
--------__init__.py(0B)
--------tests.py(4KB)
----TODO.txt(2KB)
----requirements.txt(57B)
----setup.py(933B)
----.gitignore(81B)
----README-ru.md(5KB)
----README.md(3KB)
----firstscrap()
--------proxyrefresh.py(821B)
--------conf.py(1KB)
--------listhandler.py(3KB)
--------config.txt(172B)
--------__init__.py(173B)
--------pagehandler()
----LICENSE.txt(1KB)

网友评论