文件名称:basset-ir:Basset IR-信息检索库
文件大小:644KB
文件格式:ZIP
更新时间:2024-05-17 07:03:47
nlp natural-language-processing information-retrieval language-modeling vector-space-model
巴塞特 Basset是一个全文PHP信息检索库。 这是IR领域中的一些发展的集合,并已移植到PHP上以进行研究。 通过应用先进的和实验性的IR算法和/或从不同研究研究和会议中收集的技术,Basset提供了不同的方式来搜索集合中的文档(临时检索),最值得注意的是: 文献资料 你可以阅读 使用Cranfield Collection和sample.php文件 已成为信息检索中验证系统有效性的先驱集合。 我已经将1400抽象的Cranfield集合作为XML文件包含在内,您可以将其解析为单独的文件。 可以立即执行tests / sample.php中的测试文件以进行解析并搜索单个测试查询。 根据需要自定义它。 您可以阅读Cranfield / cranfield-collection / cranqrel以了解Glassgow的qrels结果。 我还包括了SMART系统的停用词列表以进