文件名称:ranked-retrieval-search-engine:使用Python实现的通用搜索引擎,支持对结果进行排名
文件大小:7KB
文件格式:ZIP
更新时间:2024-06-07 17:33:23
Python
排名检索引擎
这是使用(VSM)进行分级检索的索引和搜索技术的Python实现。 具体而言,为向量空间评分实现了加权方案。
对于余弦值的计算,由于不影响查询文档之间的相对余弦分数关系,因此有意将查询向量长度的归一化作为优化决策而省去了。
要求
已安装
使用数字命名的组成文档建立索引和搜索的语料库(例如,NLTK数据中的路透社语料库)
索引编制
命令: $ python index.py -i
【文件预览】:
ranked-retrieval-search-engine-master
----README.md(4KB)
----index.py(6KB)
----search.py(7KB)