Open information extraction from the web

时间:2014-10-31 15:12:19
【文件属性】:

文件名称:Open information extraction from the web

文件大小:341KB

文件格式:PDF

更新时间:2014-10-31 15:12:19

信息抽取 web数据挖掘 元数据

RoadRunner算法是基于html页面格式的信息抽取算法,能够比较高效地准确抽取生成相似网页模型,并对类似网页进行信息抽取。


网友评论

  • 内容过于理论化,也过于简单,只是简单介绍了概念。不具有太多实际可操作性。