QA:信息检索实验:问答系统设计与实现

时间:2024-03-31 16:17:54
【文件属性】:

文件名称:QA:信息检索实验:问答系统设计与实现

文件大小:253.88MB

文件格式:ZIP

更新时间:2024-03-31 16:17:54

系统开源

信息检索实验:问答系统设计与实现 一,实验目的 本次实验目的是对问答系统的设计与实现过程有一个全面的了解。调优。 二,实验内容 本次实验中,首先要自己建立一个检索系统,从文本库中检索到与问题最相关的文档(可以是一个或多个)。然后对文档中的替代答案进行排序,删除出最相关的最后,在最相关的补充答案中解最精简的答案,这个答案可能是一个词或几个词。实验提供了一部分有标注的数据作为训练集和开发集,需要提交的那部分是去掉了标注的数据,最终通过提交答案和标准答案的相似度(BLEU-1值)来评估本次实验的效果。 三,实验过程及结果 3.1文本集合进行处理,建立索引 我在此章节分别使用了Whoosh开源库和BM25算法重构索引,效果上略有差异,Whoosh的top1变量为86%,top3为91%,BM25的top1为89%,top3为93%,BM25较优于Whoosh,具体讲解如下。 3.1.1使用开源库W


网友评论