BigDataAnalysis_Exp1:实时大数据分析_A-Priori算法实验

时间:2024-06-05 03:57:24
【文件属性】:

文件名称:BigDataAnalysis_Exp1:实时大数据分析_A-Priori算法实验

文件大小:1.34MB

文件格式:ZIP

更新时间:2024-06-05 03:57:24

Java

实时大数据分析实验一——A-Priori算法 一、实验内容 给定某超市购物篮数据库文件basketdata.xls,里面有18项商品的747条购买记录。取支持度阈值s =185,用A-Priori算法在Map-Reduce框架下提取其中的最大频繁项集Lk。 附件:某超市数据集basketdata.xls 二、实验设计(原理分析及流程) 该算法的基本思想是:首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第1步找到的频集产生期望的规则,产生只包含集合的项的所有规则,其中每一条规则的右部只有一项,这里采用的是中规则的定义。一旦这些规则被生成,那么只有那些大于用户给定的最小可信度的规则才被留下来。为了生成所有频集,使用了递归的方法。 三、实验代码及数据记录 1.代码 1.0 文件结构图 1.1 Can


【文件预览】:
BigDataAnalysis_Exp1-master
----apriori_result.png(31KB)
----src()
--------com()
--------jxl.jar(688KB)
----bin()
--------com()
--------jxl.jar(688KB)
----.classpath(344B)
----.settings()
--------org.eclipse.jdt.core.prefs(587B)
----README.md(21KB)
----.project(379B)
----basketdata.xls(242KB)
----eclipse01.png(12KB)

网友评论