【文件属性】:
文件名称:InfoR:用于信息检索的python包
文件大小:52KB
文件格式:ZIP
更新时间:2021-07-06 01:29:00
Python
Python中的信息检索
InfoR 是用于的 Python 包。 信息检索意味着给定一组(text/html/xml)文档,提取与搜索查询最相关的文档。 您的搜索引擎(例如 Google)是一个检索系统。
InfoR 支持 3 种类型的检索系统:
向量空间模型
语言模型
概率模型
有关这些模型的更多信息(无双关语!),请参阅
Google 使用 PageRank 算法来利用 html 文档中的超链接。 此包目前仅适用于文本文档的语料库。 我还希望添加 html/xml 支持,并希望包含 PageRank 的实现。
下载: :
安装: pip install info
依赖项:
文档: :
用法: from InfoR.VectorSpaceModels import VSM, LanguageModel, ProbModel vector space mode out