论文研究-基于最大熵分类器的Deep Web查询接口自动判定.pdf

时间:2022-09-28 01:23:36
【文件属性】:
文件名称:论文研究-基于最大熵分类器的Deep Web查询接口自动判定.pdf
文件大小:1008KB
文件格式:PDF
更新时间:2022-09-28 01:23:36
论文研究 Web中包含着海量的高质量信息,它们通常处在网络深处,无法被传统搜索引擎索引,将这样的资源称为Deep Web。因为查询接口是Deep Web的唯一入口,所以要获取Deep Web信息就必须判定哪些网页表单是Deep Web查询接口。由于最大熵模型可以综合观察到的各种相关或不相关的概率知识,对许多问题的处理都可以达到较好的结果。因此,基于最大熵模型的分类性能,利用最大熵分类算法自动判定查询接口。并通过实验,将最大熵分类法与其它常用分类方法进行了比较,结果显示它的分类性能优于Bayes方法和C4.5方法,与SVM方法相当,表明这是一种非常实用的查询接口分类方法。

网友评论