文件名称:IR-Engine:红外线作业
文件大小:5.31MB
文件格式:ZIP
更新时间:2024-06-13 03:38:00
Java
红外引擎 红外线作业 介绍 IR =信息检索 这是一个小型的信息检索引擎。 我们在此搜索引擎中用于测试的数据来自路透社。 我们执行什么? 使用发布清单,B +树来构造和存储信息和索引。 使用向量空间搜索,布尔搜索技术来搜索信息。 此外,我们还实现了一些附加功能,例如拼写校正(有效),索引压缩(减少50%的存储量)。 结构 src文件夹包含代码文件,其中Index文件夹包含Index构造系统的文件,Search文件夹包含用于搜索模块的文件,而run文件夹仅包含单个文件,该文件包含主要功能。 物料文件夹包含数据。 我们现在使用Raw_Stemmed_Dic(用于减少茎)和vb_ri.index(压缩索引)。
【文件预览】:
IR-Engine-master
----ir_system.userlibraries(66B)
----.gitignore(803B)
----src()
--------run()
--------Index()
--------wordSplit()
--------Search()
----.classpath(247B)
----material()
--------vb_ri.index(1.9MB)
--------Raw_Stemmed_Dic(703KB)
--------ri.index(4.7MB)
--------ri1_readme.txt(139B)
--------ri1.index(77B)
----.settings()
--------org.eclipse.core.runtime.prefs(50B)
--------org.eclipse.core.resources.prefs(138B)
----README.md(891B)
----out()
--------production()
----.idea()
--------misc.xml(2KB)
--------encodings.xml(164B)
--------workspace.xml(60KB)
--------vcs.xml(164B)
--------uiDesigner.xml(9KB)
--------copyright()
--------scopes()
--------compiler.xml(709B)
--------.name(9B)
--------modules.xml(258B)
----ir_system.iml(423B)
----.project(332B)
----.gitattributes(378B)
----ir_system.eml(236B)