【文件属性】:
文件名称:hadoop-apriori:使用 Hadoop 实现 Apriori 算法
文件大小:23KB
文件格式:ZIP
更新时间:2021-07-14 17:47:10
Java
Hadoop先验
使用 Hadoop 的蛮力 Apriori 算法实现。 该算法不继续建立关联规则。
用法
家庭输入输出 minsup 最大数量
hadoop jar HadoopApriori.jar com.jgalilee.hadoop.apriori.driver.Driver \
input/apriori.state \
input/transactions.txt \
output \
3 \
10 \
2
home - 每次迭代都可以写入文件名迭代状态的路径。
input - 输入交易数据的路径。
output - 为迭代 n 写入输出的路径 - 即 output/n
minsup - 被视为频繁项集的最小支持度候选项集。
max - 要运行的最大迭代次数。
number - 向 Hadoop 作业建议的减速器数量。
假设
输入数据被假定
【文件预览】:
hadoop-apriori-master
----input()
--------.apriori.state.crc(0B)
--------transactions.txt(54B)
--------apriori.state(40KB)
----build.xml(1KB)
----src()
--------com()
----run.sh(230B)
----.gitignore(17B)
----README.md(2KB)