文件名称:POA-spiders
文件大小:13KB
文件格式:ZIP
更新时间:2024-04-01 16:20:42
Python
POA蜘蛛 网络蜘蛛用于舆论分析 经过测试的环境 Windows 10专业版64位20H2 python 3.9.2 依存关系 pip install beautifulsoup4 pip install requests 要不就 pip install -r requirements.txt 如何建造新的蜘蛛 从base程序包继承BaseURLManager和BaseSpider ,然后覆盖它们的parse()方法。 BaseURLManager.parse()接收目录的页数,并返回该目录页面上的文档url。 BaseSpider.parse()接收文档URL,并在该文档页面上返回有用的内容。 待办事项清单 兰德 博客处理程序 宣传册处理程序 评论处理程序 期刊文章处理程序 多媒体处理程序 新闻发布处理程序 报告处理程序 证人处理人 睡个好觉 :sleeping_face: 有线电视新闻网
【文件预览】:
POA-spiders-main
----LICENSE(1KB)
----src()
--------base()
--------test.py(627B)
--------Rand.py(2KB)
--------CNN.py(1KB)
----.idea()
--------POA-spiders.iml(642B)
--------misc.xml(306B)
--------vcs.xml(180B)
--------modules.xml(274B)
--------.gitignore(47B)
--------inspectionProfiles()
----requirements.txt(34B)
----.gitignore(2KB)
----README.md(909B)