文件名称:Pattern-Discovery-in-Data-Mining
文件大小:379KB
文件格式:ZIP
更新时间:2024-04-19 12:24:29
R
数据挖掘中的模式发现 描述 在此编程作业中,您需要实现Apriori算法,并将其应用于从实际数据集中挖掘频繁的项目集。 输入 提供的输入文件(“ categories.txt”)由美国77,185个场所的类别列表组成。 每一行对应一个地方的类别列表,其中该列表由用分号分隔的多个类别实例(例如,旅馆,饭店等)组成。 下面提供了示例行: 本地服务; IT服务和计算机维修 在上面的示例中,相应的地点具有两个类别实例:“本地服务”和“ IT服务与计算机维修”。 Categories.txt 输出 您需要实现Apriori算法并将其用于挖掘输入数据中频繁出现的类别集。 实施Apriori算法时,您可以使用任何喜欢的编程语言。 我们只需要您的结果模式文件,而无需您的源代码文件。 实施Apriori算法后,请将相对最小支持设置为0.01,然后在77,185个类别列表上运行它。 换句话说,您需
【文件预览】:
Pattern-Discovery-in-Data-Mining-main
----Apriori Algorithm.R(614B)
----categories.txt(2.8MB)
----README.md(3KB)
----Contiguous Sequential Pattern Mining Algorithm(3KB)