inverted-index-search-engine

时间:2024-06-25 20:57:57
【文件属性】:

文件名称:inverted-index-search-engine

文件大小:543KB

文件格式:ZIP

更新时间:2024-06-25 20:57:57

Python

倒排索引 理论 倒排索引是一种数据结构,指示哪些文档包含给定的单词。 换句话说,倒排索引包含每个文档中每个词的频率。 第一步是索引文档集合以构建倒排索引。 一旦存储了倒排索引,就可以解析查询并将其与每个文档进行比较以返回相关结果。 在这种情况下,我只是计算了查询的每个单词的频率总和的基对数。 然而,存在更复杂的模型(这不是这个项目的重点)。 查看我编写的以获得更高级的评分方法。 数据库 倒排索引与 MongoDB 一起存储为 JSON 文件。 遗憾的是,如果你想要这个运行,你必须在你的计算机上安装 MongoDB。 您无需了解任何有关 MongoDB 的知识即可自行运行。 但是,如果您对 MongoDB 感兴趣,请查看我编写的。 界面 对于界面,我使用了 Qt。 有一个非常有用的工具叫做 QtDesigner,您可以在其中使用点击式界面设计界面。 保存后会生成一个 .ui 文件,您可以


网友评论