文件名称:as2015:将亚马逊评论解析为 CSV
文件大小:22KB
文件格式:ZIP
更新时间:2024-06-30 14:26:56
Java
Accumulo 峰会 2015 代码 我为支持我在 2015 年 Accumulo 峰会上的演讲而编写的代码集合。 该项目将来自亚马逊评论数据转换为 CSV 文件。 J. McAuley 和 J. Leskovec。 隐藏因素和隐藏主题:通过评论文本了解评分维度。 RecSys,2013 年。 如果您在原始数据集上重复使用此代码,请务必阅读对数据规定的限制,以符合原始所有者的要求。 解析器 将文件解析成CSV: mvn package exec:java -Dexec.mainClass=joshelser.as2015.parser.Driver -Dexec.args="-c jewelry -f Jewelry.txt -of Jewelry.csv" 原始文件被压缩。 请务必在运行前解压缩它们。 摄取 将所说的 CSV 文件导入 Accumulo: mvn packa
【文件预览】:
as2015-master
----.gitignore(38B)
----README.md(1KB)
----pom.xml(2KB)
----query.pig(877B)
----LICENSE(11KB)
----src()
--------main()
----query.hql(362B)