论文研究-基于加权频繁子树相似度的网页评论信息抽取.pdf

时间:2022-08-11 17:32:53
【文件属性】:

文件名称:论文研究-基于加权频繁子树相似度的网页评论信息抽取.pdf

文件大小:1.35MB

文件格式:PDF

更新时间:2022-08-11 17:32:53

产品评论,抽取,加权频繁子树

针对现有网页信息抽取方法普遍存在人工耗时大、抽取准确率低等问题,提出了一种基于加权频繁子树相似度的网页评论信息抽取方法WTS。首先通过视觉特征对网页进行剪枝处理;然后,通过深度加权的相似度度量方法抽取最佳频繁子树;最后,通过子树对齐方法抽取评论路径并解析评论内容。通过对京东、苏宁等网站的评论内容抽取实验,验证了WTS方法比D-EEM、POL等方法在抽取产品评论信息上具有一定的优势。


网友评论