InformationRetrieval:大数据集信息检索

时间:2024-08-03 12:16:41
【文件属性】:

文件名称:InformationRetrieval:大数据集信息检索

文件大小:1.72MB

文件格式:ZIP

更新时间:2024-08-03 12:16:41

Java

信息检索 信息检索是从信息资源集合中获取与信息需求相关的信息资源的活动。 搜索可以基于元数据或全文(或其他基于内容的)索引。 自动信息检索系统用于减少所谓的“信息过载”。 许多大学和公共图书馆使用 IR 系统来提供对书籍、期刊和其他文件的访问。 Web 搜索引擎是最明显的 IR 应用程序。 ##Projects ###program 在 Cranfield 数据库中收集有关令牌的信息 在 Cranfield 集合中,文档和字段边界用 SGML 标签(“文档标记”)表示。 SGML 标签不被视为单词,因此它们不应包含在您的程序收集的任何信息中。 此数据中的 SGML 标记遵循常规样式: <[/]?标签> | >[/]?tag (attr[=value])+> 来自 SGML 传统样式的属性和值是可选的,在这个数据集合中很少出现或根本不出现。 使用您的程序生成以下信息。 Cranfi


网友评论