文件名称:Web网页知识获取技术 (2006年)
文件大小:798KB
文件格式:PDF
更新时间:2024-06-05 18:01:57
自然科学 论文
描述一种基于类自然语言理解的Web文本知识自动获取技术。用领域文法描述Web网页文本,将该领域文法转换成描述句子信息的、符合正则表达式规范的规则,使用该规则把Web网页文本转换为表示网页知识的语义三元组,最后形成领域知识库。试验数据表明,通过本技术生成的领域知识库中不同类型网页数据的召回率平均值是71.5%,准确率平均值是79.1%。