文件名称:SIRS:简易信息检索系统
文件大小:165KB
文件格式:ZIP
更新时间:2024-07-11 18:08:51
Java
#简单信息检索系统 (SIRS) 简单信息检索系统是圣母大学数据科学组的产品。 这个项目的重点是提供一个教育搜索引擎系统,它强调速度和效率的解释。 随着系统的开发,将提供更多信息。 #组件 与任何生产质量的搜索引擎一样,创建简单的信息检索系统需要几个组件。 ##网络爬虫 网络爬虫是任何搜索引擎的必要组成部分,但超出了 SIRS 探索的范围。 尽管如此, edu.nd.sirs.websitesearch包中提供了一个简单的网站爬虫。 CrawlerProcess使用将网页下载到磁盘上的本地文件夹。 ##文档 ##解析器 ###Tokenizer ##索引器 ###倒排索引 ###直接索引 ##询问 ##检索模型 ###布尔模型 ##搜索引擎网络应用程序
【文件预览】:
SIRS-master
----.gitignore(240B)
----.project(556B)
----README.md(1KB)
----pom.xml(2KB)
----LICENSE(11KB)
----src()
--------edu()
----.classpath(606B)
----qrels()
--------boolean_qrels.txt(190B)
--------cosine_qrels.txt(335B)