文件名称:arXiv-Search:基于 Elasticsearch 和 fastapi 的 arXiv 论文搜索引擎
文件大小:11.22MB
文件格式:ZIP
更新时间:2024-08-23 22:41:38
search-engine elasticsearch fastapi arxiv-paper-search-engine HTML
arXiv-Search An arXiv paper search engine based on Elasticsearch and fastapi. Description 基于 上的数据的一个论文检索系统,可以通过输入标题、作者、摘要中的关键字进行检索,方便研究人员高效地搜索相关论文。 爬虫部分代码略去。爬取论文标题、作者、摘要、提交日期和 pdf 链接共 5 个字段,数据格式如下 (): "0": { "abstract": "", "authors": "", "pdf_link": "", "submitted_data": "", "title": "" } 系统分为后端 Elasticsearch 部分进行检索支持,在标题、作者、摘要三个字段上采用 BM25 计算查询与文档的相似度,并通过 fastapi 框架返回到前端进行搜索结果的展示。 Modu
【文件预览】:
arXiv-Search-main
----data()
--------data_0.json(178B)
--------data.tar(31.15MB)
----src()
--------main.py(8KB)
--------templates()
--------ElasticSearch.py(7KB)
--------static()
----results()
--------result1.jpg(387KB)
--------result2.jpg(403KB)
----README.md(2KB)