lash:具有层次结构的大规模序列挖掘

时间:2021-06-19 09:54:57
【文件属性】:
文件名称:lash:具有层次结构的大规模序列挖掘
文件大小:71KB
文件格式:ZIP
更新时间:2021-06-19 09:54:57
Java 睫毛 #介绍 LASH 是一种可扩展的分布式算法,用于在存在层次结构的情况下挖掘序列模式。 LASH 将一系列序列作为输入,每个序列都由一些特定于应用程序的词汇表中的项目组成。 与传统的序列挖掘方法相比,词汇表中的项目按层次排列:输入序列和序列模式都可能由来自不同层次层次的项目组成。 例如,文本文档中的单个单词可以按句法层次结构排列:单词(例如,“lives”)泛化到它们的引理(“live”),然后泛化到它们各自的词性标签( “动词”)。 客户交易序列中的产品也形成了自然的产品层次结构,例如“Canon EOS 70D”可以泛化为“数码相机”,泛化为“摄影”,进而泛化为“电子”。 诸如人员之类的实体可以排列在“语义层次结构”中; 例如,“Barack Obama”可以概括为“politician”、“person”、“entity”。 这种概括使我们能够找到原本会被隐藏的序列。 例如,在文
【文件预览】:
lash-master
----bin()
--------lash(731B)
----pom.xml(3KB)
----src()
--------main()
----LICENSE.md(11KB)
----.gitignore(39B)
----README.md(6KB)

网友评论