文件名称:ACRA:亚马逊客户评论分析
文件大小:3.94MB
文件格式:ZIP
更新时间:2024-07-27 16:54:09
Java
亚马逊客户评论分析 这是 Web 数据挖掘作业的一部分。 亚马逊客户评论分析项目旨在从基于网络的购物服务亚马逊中提取和分析客户对产品的评论。 这个项目有几个部分。 网络爬虫 首先是网络爬虫。 这会从亚马逊产品 URL 获取客户评论。 命令行参数采用任意数量的 URL 并遍历评论页面,并将与这些评论相关的所有评论和相关信息提取到 JSONObjects 中,然后将其存储在文本文档中。 预分析 其次,有一小段代码从文本文档中提取所有 JSONObjects,并将所有文本评论放入一个巨大的评论中。 这稍后由斯坦福 NLP 核心的 SPIED 进行分析,它根据种子术语提取类别中的术语。 分析 在我们的实施中,我们使用了一些我们认为与评论中仅描述产品的术语相关的种子词。 我们是手动完成的。 更好的实施是使用黄金标准评论来提取这些种子,然后使用这些种子更准确地提取评论中仅描述产品的那些术语。 结果
【文件预览】:
ACRA-master
----README.md(2KB)
----ACRA()
--------.project(363B)
--------src()
--------lib()
--------stanford-corenlp-full-2014-10-31()
--------.settings()
--------Reviews-Gold()
--------Reviews-Results()
--------Reviews()
--------.classpath(546B)
--------bin()