文件名称:frequent-pattern-mining:在python中使用Apriori实现频繁模式挖掘。 它还可以从频繁的项目集中挖掘封闭模式和最大模式
文件大小:394KB
文件格式:ZIP
更新时间:2024-06-03 19:28:34
Python
#frequentPattern.py使用Apriori生成从vocab.txt和topic-i.txt到patterns / pattern-i.txt(其中0 <= i <= 4)的频繁项目集。 ## vocab.txt将术语映射到索引的字典。 格式:索引词列由制表符分隔。 ## topi-i.txt频繁模式挖掘算法的输入文件。 每行代表一个带有术语索引的交易。 格式:term1_index term2_index term3_index ... 列之间用空格隔开。 ## pattern-i.txt频繁模式挖掘算法的输出文件。 每行代表一个事务,其中频繁的项目集按支持计数的降序排列。 格式:support_count term1 term2 ... support_count和term1用制表符分隔,而术语用空格分隔。 ##用法 topic-i.txt和vocab.txt应该与
【文件预览】:
frequent-pattern-mining-master
----codes()
--------maxPattern.py(2KB)
--------frequentPattern.py(3KB)
--------closedPattern.py(2KB)
----data()
--------topic-4.txt(155KB)
--------topic-0.txt(165KB)
--------topic-1.txt(154KB)
--------topic-3.txt(153KB)
--------vocab.txt(165KB)
--------readme_given.txt(681B)
--------topic-2.txt(159KB)
----results()
--------closed()
--------max()
--------patterns()
----README.md(2KB)