文件名称:devsearch:使用Python构建的网络搜索引擎,使用TF-IDF和PageRank对搜索结果进行排序
文件大小:17KB
文件格式:ZIP
更新时间:2024-02-24 23:48:32
python search search-engine flask crawler
开发搜索 使用Python构建的网络搜索引擎,使用TF-IDF和PageRank对搜索结果进行排序。 叠放 烧瓶(Python 3) cra草 LXML MongoEngine(MongoDB) 引导程序4 要求 码头工人 Docker撰写 建立 安装Docker和Docker Compose。 克隆或下载此仓库。 从.env.example创建一个.env文件。 运行docker-compose up 。 爬行 更新SPIDER_ALLOWED_DOMAINS在.ENV你想要的蜘蛛爬行域变量。 将至少一个URL添加到crawl_list集合(在MongoDB中),以使蜘蛛开始使
【文件预览】:
devsearch-master
----nginx()
--------conf.d()
----devsearch.egg-info()
--------PKG-INFO(183B)
--------requires.txt(92B)
--------SOURCES.txt(351B)
--------top_level.txt(10B)
--------dependency_links.txt(1B)
----devsearch()
--------models.py(2KB)
--------spider.py(3KB)
--------templates()
--------context_processors.py(437B)
--------indexer.py(3KB)
--------commands.py(905B)
--------static()
--------pagerank.py(2KB)
--------__init__.py(827B)
--------views.py(3KB)
----Dockerfile(302B)
----tests()
--------.gitkeep(0B)
----.env.secret.example(167B)
----mongo()
--------data()
----wsgi.py(90B)
----.env.example(201B)
----docker-compose.yml(417B)
----setup.py(336B)
----.gitignore(22B)
----docker-compose.prod.yml(590B)
----README.md(1KB)